大数据落地:众之所盼,却含苞晚放
翻阅a&s安全自动化的历史技术文章,不乏大数据、云计算的技术文章,谈得多了,听得多了,似乎大数据距我们咫尺之遥,呼之欲出;但实际上,大数据始终虚无缥缈,吵吵嚷嚷转头空,回头望月,大数据仿佛仍与嫦娥戏耍。
而从各设备商历史论点看,2014年年底,a&s拜访大华股份大数据、云存储事业部负责人时,所谈论的观点,是大数据最为贴切可落地的理论。待a&s正式面对面接触到大数据产品时——来自宇视科技的DB9500 & DR9500大数据计算集群,此时时间轴已经转到了2015年下半年,这是一套最早于2013年底在丹东项目上投入运行的大数据系统,也曾被行业资深人士评为最早落地的大数据产品。此后,各家的大数据系统开始纷纷涌现。
多年期盼,大数据终于在蹒跚中来了。一经落地,其发展速度之迅猛,超乎行业想象,一时间无论是硬件制造商还是软件开发商,几乎都跟大数据或多或少扯上了关系。
而大数据的落地及遍地开花,似乎昭示着安防产业即将再掀风云。
大数据拔高了安防入门门槛
大数据技术早在IT领域得到了应用,如当下的百度搜索引擎等,用的就是大数据技术;当安防提升到IT技术层面,产业将会面临两极分化的加剧。
从当前产业看,首先推出大数据技术的,清一色为主流设备商或颇具实力的平台厂家,比如IT背景的宇视科技,传统安防厂家海康威视、大华股份、苏州科达,软件平台商东方网力、中盛益华等,无一不是一方枭雄;中小企业与之相比,差距不断拉大。其次是国内安防企业的国际领先性,从目前看,国际安防品牌企业也在跟进大数据技术的开发,但进度缓慢,此前一直牢据世界安防50强第一名的霍尼韦尔,至今未见其在中国大陆的进一步动作;而泰科、UTC、安讯士、三星安防等众企业关于大数据的介绍也是鲜少得到披露;即便有,与大陆的大数据分析也存在很大的不同,比如泰科、UTC,其已在门禁领域推出了大数据管理系统,但也是去年才面世,与视频监控将非结构化数据处理为结构化数据的深度分析是两种不同类型的应用模式。
最近轰动圈内的大新闻则为戴尔进入安防,戴尔的IT技术、存储技术、硬件制造能力强劲,但没有安防积累,无论其要将自身优势移植到安防还是从零开始,安防产业的升级都能让戴尔短时间内难以找到适合的切入点,而产业的不断变化,随着时间的推移,其进入安防的困阻会变得更大。对中小企业来说,没有相应的项目(需求)支撑、技术积累,则将难以脱掉产业转型期间的陪跑角色。
采集端重要性日渐凸显
此前在谈大数据时,都会强调前端采集设备的重要性,如数字化、网络化、高清化、智能化。但实际上,前端采集设备的提升,核心元组件的成熟成了重要依赖,如传感器和处理芯片,共同推动了高清化、智能化;倘若成像稍有处理不当,就会出现数据分析不准确,最终导致大数据应用不准确的情况,如宽动态,处理技术达不到需求水平时,需要分析的部位无法识别,数据的结构化也就无法完成了;再比如当前大数据的主流应用领域——车辆识别,若摄像机对眩光无法很好抑制,或是图像色彩不准确,将在车辆色彩特征分析中带来极大 麻烦;即便算法识别准确,但是算法的计算设置不当,也会误导大数据检索,比如挂着红色横幅的蓝色车,部分系统会将车色识别为“红色”。
大数据应用的准确性,前端算法是基本保证,数据结构化处理的准确性是基础,两者只要稍有差错,识别的结果将会是另一番景象。
以目前的前端成像技术来说,虽然水平已经很高,但仍存在很多不足,清晰度算是比较高度统一的,如4K,整个行业几乎都做到了2200TVL,但宽动态、色彩还原、星光级夜视能力还是存在较大差距,即便同一个设备商、同样算法的两款不同样式产品的效果也存在天壤之别。
结构化偏科:直指大交通
不可否认,交通是安防领域中人工智能发展最为成熟的科目,可识别的内容页很多,包括拍摄方向、是否机动车、车牌号、车牌色、车标、车色、车身重要特征以及压黄线、闯红灯等违规检测,还可通过地感线圈或视频、微波感知车速,仅车标一种,目前已知可识别的种类超过了3600种,且可结合车管所数据库,实时更新识别模型。数据分析成功率高,在as的测评中,大部分可做到98%以上的识别率,部分达到了100%(样本测试),确保了数据结构化的准确性。
但大数据的应用类型很多,绝非车辆识别一种。不过从目前公开的大数据开发 情况,除少数门禁平台外,几乎清一色为针对车辆的检索应用。或许人员卡口产品的出现会稍微丰富大数据类型,但人员卡口是自科达的感知型摄像机推出后才获得快速发展,目前应用少、识别的准确性也还在不断提升当中,尚难以形成规模化应用。而对物品的识别,一个是作为半结构化数据采用,另一个则是将物品识别作为人员卡口、车辆卡口的附加检测特征来使用,应用扩展性有限。
应用:二次结构化才是重点
数据结构化的大数据应用的基础,其原理无外乎将视频等非结构化数据经过处理分析后,提取视频特征,并以文本形式保存,同时对文本与原非结构化数据进行关联,以便在检索时能快速对应到原始数据。
而数据的结构化主要有两种方式,一是成像时即进行结构化处理;二是通过后台服务器进行数据二次分析从而实现结构化处理。从目前看,大部分摄像机都是非结构化或半结构化产品,可提供的结构化数据有限;不过智能交通卡口摄像机和新一代人员卡口摄像机可以实现前端数据结构化,可直接将结构化数据提供给分析后台使用;但实际项目中,品牌庞杂易造成兼容性、原有结构化前端可执行的结构化内容有限、非结构化设备量大等问题,后端结构化处理渐渐成了重点,即二次结构化。
硬件选配:各显神通
就目前来看,各家二次结构化处理平台所采用的服务器均不一样,从2U到4U、单处理节点到多处理节点均有,服务器供应商也是品牌多样,如凌华、浪潮、IBM等均有;共同点是均为基于英特尔高性能芯片开发的X86架构服务器、Linux操作系统。
从目前了解的情况看,海康威视采用的硬件应为4U多节点高性能服务器,最高支持160路1080P视频流实时处理;大华股份为2U 4节点处理单元,支持每天600万张图片分析性能;东方网力应为2U处理机型;科达亦有可能采用的是2U处理机型。而宇视经过升级,最新的产品为2U服务器机型,实现了数据服务器与搜索引擎的二合一。
应用:千亿秒级检索,需求策动
数据结构化之后,以文本形式进行存储和关联,第一代大数据检索平台的检索速度约为百亿数据秒级检索;而优化后的新一代平台,理论上均可实现千亿级数据秒级检索。从实测效果看,目前已知的各厂家大数据平台均未达到千亿级容量,实测平台数据库从几万到几十万不等,不过无论是实战平台还是模拟平台,秒级检索均不存在问题。
大数据基本可实现三大类型检索:人、车、物,且以车辆检索成为最主要应用类型,并由大数据衍生出数十种应用,主要有如下三大类型:
·秒级检索,如卡口机动车、区间机动车、外地机动车、异常牌照、违法、布控告警、红名单车辆、非机动车等查询功能;
·车辆研判,如套牌分析、跟车关联性分析、车辆轨迹碰撞、首次进城、高危时段、昼伏夜出、频繁夜出、多次进城不出城、车辆异常行为、单日过城、隐匿车辆、落脚点分析、综合研判等;
·智能布控。支持导入车管所车辆数据库,主要提供有车辆布控、专项整治、特种车辆管理等功能,可实现大货车、黄标车、车辆限行布控。
需要说明的是,人员卡口同样可实现检索、研判、布控功能,目前发展的重点是提升人员、人脸特征的识别与分析能力,如脸型、身高、胖瘦、衣着、民族等特征的识别。
标准未形成,但行业高度默契
从口号到落地,大数据应用历经了模拟、数字两代安防人的共同努力,在2015年之前,鲜见公开的大数据产品,而自a&s首度曝光后,主流设备商均推出了各自的大数据平台产品。
但作为新兴事物,至今国家没有相关的行业标准,也无法统一规范大数据如何做。不过,虽然各家的硬件各不一样,但软件层面却高度统一,如上部分所介绍的三大应用类型:秒级检索、车辆研判、智能布控,从主要应用类型到细化功能,几乎一模一样,昼伏夜出、告警检索、黄标车布控等,高度统一。可以说,虽然标准未出,但应用层的设计,倒是实现了高度统一,即便有差异,也相差不大。
那么这些应用从何而来?从实地测评走访可以推断,基本都是来自于客户的需求开发;但因各家都是基于大数据来实现应用,应用的开发不难,因此不排除部分没有实际项目需求的平台有借鉴之嫌。
需求策动和相互借鉴之下,导致了大数据应用不约而大一统的“标准化”局面。在笔者看来,这未必是好事,因为虽然中国大陆各地在相关交通法规要求下实现了标准化的大一统,但实际上各地还是有不少独特之处,如摩托车、电动车检测需求、旅游区的特色运营车辆等,但至今未见有体现,这也造成了国内大数据平台缺乏鲜明的个性化特征。
应用效果趋于理想,但投入产出比低
单从文本信息的检索和大数据分析结果看,秒级检索结果精确度还是非常高的,尤其是基于车牌号的检索及应用,达到了非常高的应用价值,这在实际项目中已经得到了验证。
不过由于前端抓拍设备的成像问题、算法处理问题,还是会有一些识别错漏的请,主要集中在颜色的识别上,比如黑色识别,当稍微有反光,算法极易将黑色的车判断为蓝色的车。大数据分析现存的问题,将会推动设备商对自身成像设备的改进,另外也会对算法进行优化,除了分析精准度外,特征识别还较难实现定制化,目前的车辆特征识别(以图识图),基本是基于车辆特征库实现特定特征检测,若算法检测不出,也无法通过手动选择。
虽然大数据已经实现了较好的应用效果,在一些实战项目中,也排查了很多套牌车,如宇视的丹东项目。但仔细分析发现,大数据平台的产出不高,如电警功能,已于前端的智能交通摄像机实现,二次识别产生二次效益不高,尤其是难以产生明显的二次经济效益,相对整套系统来说,投入产出比不高。结合建设需求,可以断定,目前的车辆大数据平台的效益,将主要应用于三个方面:
a、 智能管理:即取代人工管理,提升平安城市的智能化水平;
b、 案件检索:利用大数据分析能力,为案件的分析、排查提供线索;
c、 利民工程:开放部分功能作为民生工程,服务当地百姓,如失窃车辆找回等。
而在事件预判方面,以目前的大数据技术能力,还稍有欠缺,其深度学习还严重依赖人工升级;不过这也侧面说明大数据应用开发仍有很大的发展前景,仍需产业同行继续努力。