视频监控智能分析的关键在视频源的清晰度,如果通过视频结构化技术对录像进行特征提取时,视频源的清晰度无法达到指定的要求,智能分析就无从谈起。当前,为了解决视频源的清晰度问题,方法有很多,比如直接标清换高清、枪球联动、鱼球联动等,这些技术方案虽然在一定程度上解决了监控抓拍视频源清晰度不足的问题,但在技术及应用层面,并非最佳的选择。
人眼摄像机的技术分析原理
视频监控智能分析的应用,目前主要在人脸识别及车辆识别,因为车辆本身特征较为固定,特征提取也相对容易。在人脸识别领域,因为被监控人的主动意识比较强,加上应用场景的复杂化和机动性,使得实验室算法的人脸精度在进入具体的功能应用中,准确率大大降低,业务效率大打折扣,公安等部门在智能分析方面的投入因此也变得谨慎。
但是视频监控高清技术的后续发展,北京格灵深瞳信息技术有限公司产品总监谭勇认为是视觉分析,并且会在未来3-5年内成为行业主流技术趋势。对此,格灵深瞳作为一家人工智能领域的算法公司,今年推出了区别于传统监控摄像机抓拍人脸的前端IPC——人眼摄像机。这款产品解决了视频监控看得广、看得远、看得清的问题。
根据目前通用摄像机的技术方案,要实现人脸的识别,距离要求是在3-5米内,而格灵深瞳的人眼摄像机能够实现50米外动态捕捉到清晰的人脸,在100米外清晰地捕捉人体的特征,它既可以检测人,也可以检测车。
对于这个技术的理解,目前一般市场上的人脸检测是根据人眼两个瞳孔之间的距离去检测,而格灵深瞳是基于人的半身,即先检测出人,然后根据人的局部特点进行放大,在放大到一定程度后再把人脸抓拍出来,所以这就不依赖于看不看得清人的眼睛。总的来说,基于人的体态特征进行检测,这种检测的适应性要更好,并且对于距离没有那么强烈的要求,检测准确率方面,50米外,在标注的敏感区内,只要人出现,就可以在相应的时间段内几乎是百分百的抓起,除非是运动特别的快,但是只要在场景停留1-2秒就可以抓到,而一般情况下,1-2秒内要在50米开外的监控区域内消失,几乎是不可能的。
人眼摄像机的识别类目
在监控摄像机的智能分析检查类目中,人眼摄像机主要识别有四种:一是人脸的识别;二是行人的外貌特征的识别;三是机动车的识别;四是非机动车的识别。当然也会有其他厂商做动物及其他物品的检测,但这部分其实市场需求很小,因此专注公安及交通市场,需要对这四种类目进行重点的检测。
在行人的检测和识别方面,人眼摄像机检测的特征接近30种,主要有五类特征检测:第一类是人的年龄和性别;第二类是人的头部特征,比如戴不戴口罩、眼镜和帽子,第三类是上身特征,比如长短袖,衣服颜色和纹理;第四类是下身特征,比如长短裤,是裙子还是短裤、颜色等;第五类是其他特征,比如背包、箱子等。在国内厂商中,基于人的特征检测格灵深瞳基本上是最全的,比其他厂商更有优势。因为只有当你有了更多的特征分析,你才能进行更多组合化的检测分析,因此特征提取是最基本也是最重要的前期技术。
但是人的检测其实是最快的,基本上零点几秒就能实现,更多的时间是花在识别上,格灵深瞳视频的并发能力在行业里面是靠前的,针对人的人脸行为特征识别、车辆识别和非机动车的识别,并发的能力在一个显卡处理的情况下,可以做到30路1080P的实时并发处理。
格灵深瞳去年推出了基于三维图像技术的行为分析仪——晧目摄像机,其主要应用场景为室内。今年推出的人眼摄像机,是为了应对公安在室外的复杂场景的智能分析的需求。作为一家智能算法科技企业,格灵深瞳谭勇强调,虽然格灵深瞳并不擅长于生产制造,但是我们会找到比较强的制造伙伴,比如江浙或者深圳的工厂,与它们进行深度的合作,包括供应链、生产、组装及测试,利用双方的技术优势,通过强强联合,解决大家关注的技术产品化的问题。