前言
无感通行一定是未来出入口控制系统的发展趋势,无闸机、无需人员配合即可便利通行,但又能保障系统的安全性。人工智能(AI)技术给无感通行带来无限的可能性。
近30年来对整个安防系统,乃至整个弱电系统来说,发生革命性技术突破的当属视频监控技术,其核心就来源于AI技术中的计算机视觉技术。如今的监控技术可以广泛应用于监控、门禁、车辆出入、访客、消费、考勤、电梯控制、入侵报警,人脸识别技术应用就是典型场景代表,人脸识别+门禁、人脸识别+电梯、人脸识别+停车场,而人脸门禁就是其中最典型的革新应用之一,正是本白皮书要深入予以探讨的。
无感通行整体解决方案就是系统全面支持多种出入控制方式:刷门禁卡、刷身份证、刷银行卡、刷二维码、指纹识别、指静脉识别、支付宝、微信、Apple Pay、虹膜、人脸识别、声纹识别等,全部支持,或者最少支持2种以上的设备才是未来技术的主流。
AI智道联合人人智能、赛翼智能发布本人脸门禁产品技术白皮书,用于促进行业的技术发展和技术进步,共同开拓全新的门禁市场,集合行业力量,整合多种资源,逐步建立起优高效的产业生态。
本白皮书将从人脸门禁产品应用场景分类、产品类型分级、主要功能划分、产品形态、硬件、软件、测试检验方法、行业解决方案、未来发展趋势多个章节进行论述。本书可供门禁系统从业者、人工智能从业者、专家、安防从业者、设计院、政府相关部门、学生、工程商、集成商等相关人士阅读、参考。
概述
系统概述
人脸门禁系统是人工智能技术在出入口通行领域的典型场景应用,目前正处于用人脸识别技术代替传统IC卡的升级换代时期。门禁系统和建筑智能化系统的出入口通行系统经过多年的发展已经有了稳定成熟的以IC卡为主的技术体系,系统封闭、行业缺乏统一标准、用户体验和用户交互流程差异很大的一些局限。尤其是门禁卡和人员弱关联,代打卡、冒名顶替时有发生,存在很大的安全隐患,只认卡不认人。而人脸识别技术是人工智能在视觉识别领域发展最快的技术之一,非常好的解决了人员身份鉴别和权限统一的问题。当然新生事物也有一定的局限性,比如存在技术和产品的结合尚未形成统一标准、各个厂商自成系统难于兼容等问题。为了更好的让用户理解人脸门禁产品的应用优势和局限、指导厂商逐步建立逐步一致的人脸门禁的产品定义和功能描述,减少重复开发和技术概念混乱,AI智道(公众号:AIoWord)联合人人智能、赛翼智能等厂家制定本人脸门禁产品技术白皮书,用于建立行业统一的技术共识。本白皮书采用在线发布、图书出版、共同更新维护的形式,集合行业力量,逐步建立统一高效的人脸门禁产品体系,促进行业的发展。
门禁系统
门禁系统(Access Control System)又被称为出入管理控制系统,是安全防范管理系统的重要组成部分。门禁系统集自动识别技术和安全管理措施为一体,涉及人工智能、电子、机械、生物识别、光学、计算机、控制、通讯等技术,主要解决出入口安全防范管理的问题,实现对人、物的出入控制和管理功能。常见的门禁系统有独立式密码门禁系统、非接触卡式门禁系统、生物识别门禁系统、手机APP门禁系统等,曾经应用最广泛的非接触卡式门禁系统逐渐被生物识别门禁系统所替代,尤其是人脸识别。
典型的联网门禁系统由门禁服务器、门禁管理软件、控制器、接口模块、读卡器、人证合一一体机、卡片、电锁、出门按钮、紧急玻璃破碎器和蜂鸣器等设备组成。读卡器包括指纹、声纹、人脸、虹膜、卡式多种类型。
门禁系统在国内外的应用是有一定区别的,门禁系统最早出现在国外,技术发展比较成熟,通常都是联网的总线式门禁系统,门禁系统包含考勤、在线巡更功能,可以集成报警系统,能够和视频监控系统进行联动;而国内的门禁系统一般被归入一卡通系统建设,而一卡通系统通常包括门禁系统、访客系统、考勤系统、巡更系统、消费系统、电梯管理系统和车辆出入管理系统,这个范围要较国外的门禁系统要大,功能就相对简单一些。随着AI技术的成熟,人脸门禁正在大行其道,正在改变整个市场格局。
门禁系统适用各种场所,如银行、酒店、机房、机要室、办公室、智能化小区、工厂等。在数字技术网络技术飞速发展的今天门禁技术得到了迅猛的发展。早已超越了单纯的门道及钥匙管理,它已经逐渐发展成为一套完整的出入管理系统。它在工作环境安全、人事考勤管理等行政管理工作中发挥着巨大的作用。如今的无感通行系统中不一定会存在实体“门”,也许“门”是通道闸机、“门”是电梯、或者根本就没有“门”(虚拟的)。
门禁系统从技术维度可分为:电子密码门禁系统、卡式门禁系统、指纹门禁系统、指静脉门禁系统、掌纹门禁系统、虹膜门禁系统、声纹识别门禁系统和人脸识别门禁系统等。
本白皮书聚焦在人脸识别门禁系统,故以此为主。
人脸识别技术
人脸识别(Face Recognition,FR)是一种基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点:
非强制性。用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有“强制性”;
非接触性。用户不需要和设备直接接触就能获取人脸图像;
并发性。在实际应用场景下可以进行多个人脸的分拣、判断及识别。
除此之外,还符合视觉特性:“以貌识人”的特性,以及操作简单、结果直观、隐蔽性好等特点。
人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期;最近几年随着以深度学习为主的人工智能技术进步,人脸识别技术得到了迅猛的发展。“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,是综合性比较强的系统工程技术。
人脸识别系统通常包括几个过程:人脸图像采集及检测、关键点提取、人脸规整(图像处理)、人脸特征提取和人脸识别比对。
人脸图像采集。不同的人脸图像都能通过摄像镜头采集下来,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。
人脸检测。人脸检测在实际中主要用于人脸识别的预处理,即在图像中准确标定出人脸的位置和大小。
关键点提取(特征提取)。人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也称人脸表征,它是对人脸进行特征建模的过程。人脸特征提取的方法归纳起来分为两大类:一种是基于知识的表征方法;另外一种是基于代数特征或统计学习的表征方法。
人脸规整(预处理)。对于人脸的图像预处理是基于人脸检测结果,对图像进行处理并最终服务于特征提取的过程。系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理。对于人脸图像而言,其预处理过程主要包括人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等。
人脸识别比对(匹配与识别)。提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配,通过设定一个阈值,当相似度超过这一阈值,则把匹配得到的结果输出。人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。可分为1:1、1:N、属性识别。其中1:1是将2张人脸对应的特征值向量进行比对,1:N是将1张人脸照片的特征值向量和另外N张人脸对应的特征值向量进行比对,输出相似度最高或者相似度排名前X的人脸。
人脸识别的优势在于其自然性和不被被测个体察觉的特点。
所谓自然性,是指该识别方式同人类(甚至其他生物)进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有虹膜识别、语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。
不被察觉的特点对于一种识别方法也很重要,这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,不同于指纹识别或者虹膜识别需要利用手指接触的传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而造成诸多不便。
人脸识别被认为是生物特征识别领域甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是人脸作为生物特征的特点所带来的。
相似性。不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。例如双胞胎现象,指胎生动物一次怀胎生下两个个体的情况。双胞胎一般可分为同卵双胞胎和异卵双胞胎两类。在人类社会,全世界双胞胎平均出生率为1∶89。对于人类的双胞胎现象,有些双胞胎面部存在差异,有些双胞胎甚至从面部特征来看相似度极高,对于人脸识别系统形成非常大的挑战,几乎从生物特征上很难区别出每个个体。
易变性。人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发、胡须等)、年龄等多方面因素的影响。
易攻击性。随着数字拍照、视频合成技术等发展,越来越容易获得某个指定人的人脸信息或者合成人脸信息。更甚至随着对抗训练(Adversarial Training)的深度学习技术的发展,计算机可以合成高精度的任何人的人脸等生物特征信息。某些生成对抗网络训练的反人脸识别,身份欺骗成功率达99.5%,甚至成为许多人脸识别系统的克星。
产品的场景化分类分级模型
人脸识别门禁控制系统基于先进的人脸识别技术在门禁出入口领域的应用创新。相比钥匙门禁、IC卡门禁、指纹门禁、虹膜门禁等其它技术手段,人脸门禁如果有以下优势:
人脸识别无卡进入,免去携带卡证的额外工作;
高速准确方便快捷,人脸识别通常在1秒以内完成甚至可实现无感自然通行;
照片记录可追溯验证;
同时人脸门禁也存在一些风险:
对于高相似人脸或者双胞胎等存在一定的误识风险;
人脸识别容易受到一些技术手段的攻击;
人脸识别涉及到隐私权等风险。
总体来说人脸识别门禁是门禁系统的一次重大技术变革,将门禁智能通行带入了全新的AI时代。
本白皮书的关键内容,是对人脸门禁的产品应用场景、产品技术形态分为三类六等,树立了对人脸门禁产品应用和开发的技术指导,这也是本次白皮书重大的创新。这个分类办法结合了对门禁应用场景和人脸识别技术的深入调研需求提炼和技术分析,欢迎广大读者提出宝贵意见以便于编者修改完善。
门禁通行的应用场景分为三类:
强配合类。人脸与设备距离0.5米以内,人脸角度在15度以内,人脸比对模式为1:1人证比对或者<1000人的小型人脸库比对。如家庭人脸门锁、办公室小型人脸门禁、人脸考勤等。
半配合类。人脸与设备的距离在0.5米-1.5米之间,人脸角度在30度以内,人脸比对库容量在10000人以内的中等规模人脸库。如智能建筑楼层人脸门禁、社区单元人脸门禁等。
自然通行类。人脸与设备的距离在1米到3米之间,人脸角度在45度以内,人脸比对库容量在1万到10万人以内。如园区出入口人脸通行、公共交通人脸闸机等。
人脸门禁产品的技术等级划分为六级:
第一级:学术级。人脸库容量在百人左右,准确度在60%以下,用于新技术的学术分析;
第二级:娱乐级。人脸库容量在500人左右,准确度在60-85%之间,用于娱乐游戏出错无直接风险;
第三级:消费级。人脸库容量在1000人以内,准确度在85-95%之间,用于个人领域或中小企业;
第四级:商业级。人脸库容量在1千-1万之间,准确度在95-99%之间,用于中等规模企业应用;
第五级:行业级。人脸库容量在1万到10万人左右,准确度在99-99.999%之间,用于超大规模企业或者公安、交通等海量人群应用;
第六级:金融级。人脸库容量在10万人以上,准确度在99.999%以上,出错率低于十万分之一,可用于金融支付等应用领域。
总结:通过按三种类别、六个级别的细分应用,可以将人脸门禁产品的应用场景和产品技术特点较好区分出来,为后续产品应用和产品开发提供指导。
第一篇 应用场景分类
人脸门禁系统如果按照应用场景分类,可分为三类:强配合类、半配合类和自然通行类。
强配合类应用
强配合类应用主要应用于传统近红外人脸门禁、智能锁、柜和设备等。个人、家庭、中小企业的人脸识别门禁或者设备的应用,往往用户人脸库规模小、设备成本低、有时候需要设备提供电池供电的低功耗场景等应用需求,这种应用场景往往是强配合类应用。
强配合应用情况下,典型人脸库容量在50-1000人之间,在识别时需要将人脸距离设备在0.5米以内,人脸与设备之间的夹角在15度以内几乎完全正脸状态。强配合类应用的人脸识别技术精度要求有限、设备成本低、功耗低,往往适用于小规模场所。
关键参数:
人脸库容量:1000人以下
人脸识别距离:1米以内
人脸检测比对搜索时间:<3秒
人脸识别角度:15度以内,需要特意配合
半配合类应用
半配合类主要应用在建筑楼层通道门禁等场景。在企业楼层、办公室门禁、电梯、社区单元门口等应用场景下,通常是企业或者小区将人脸门禁代替传统的IC卡或钥匙门禁,适用采用半配合类人脸门禁。
半配合类的人脸门禁人脸库在10000人以内,门禁使用时人与设备的距离 在0.5米到1.5米之间,可以实现人脸与设备有一定的夹角如30度以内,甚至在理想情况下实现人到门开的不停留通行状态。
关键参数:
人脸库容量:1万人以下
人脸比对距离:0.5-1.5米
人脸检测比对搜索时间:<1秒
人脸识别角度:30度以内,半配合状态
自然通行类
自然同行类就是人不用可以配合系统的应用,比如园区建筑出入口室内外应用及人脸自然签到。在住宅社区门口、大型建筑的出入口、大型演出或展会活动时,通常需要自然通行的人脸门禁产品。自然通行人脸门禁往往人脸库规模可达1万到10万人左右,人脸与设备的距离可在1到3米左右,而且能够适合室内和室外等各种的光线环境,人员通行能够做到完全的不停留通行和人脸比对分析。
关键参数:
人脸库容量:1-10万人
人脸识别距离:1-3米
人脸检测比对搜索时间:<0.5秒
人脸识别角度:45度以内,与通行路线一致,不影响自然通行状态
总结:人脸门禁应用的发展趋势是从强配合向半配合过渡、进而向自然通行发展的趋势,科技让生活服务变得越来越便利化。同时在强配合型应用领域从近红外的企业人脸识别,向家庭的人脸门锁扩展,但由于人脸门锁对人脸识别技术的抗攻击能力带来全新的挑战,人脸门禁的发展状态尚存在较多不确定因素。
第二篇 产品类型分级
人脸门禁产品的技术等级划分为六级:学术级、娱乐级、消费级、企业级、行业级、金融级。
第一级:学术级
学术级技术精度通常是指可重复的准确度在60%以下,用于原理检验和理论创新,往往不一定对应具体的产品。有些学术级技术可在实验室的理想条件下取得很高的人脸识别精度,但是在现实环境应用时由于光线、镜头、计算资源等多种原因往往无法复现实验室成果,甚至有些学术论文的理论成果也难以持续复现,学术级的往往不对应具体的量产产品。
第二级:娱乐级
人脸识别的某些细分功能在有些应用领域的成熟度不高,比如通过人脸识别来分析人的年龄、性别,甚至通过人脸识别来区分双胞胎或者脸部高相似人群等,人脸识别通常的成功概率低于85%以下,这样成熟度的技术通常用于做娱乐型产品。
例如用于人脸识别的属性分析或者娱乐游戏产品等。
第三级:消费级
人脸识别应用通常在中小规模人脸库如千人以内、中近距离如半米以内有较高的人脸识别精度时,人脸识别可用于家庭、商铺或中小企业等,作为消费级应用的产品。目前大量基于近红外技术的人脸考勤机、人脸门禁级通常是消费级产品 。
第四级:企业级
企业级人脸门禁产品通常用于中大规模的企业或者居民社区、行政单位的智能通行应用。人脸库容量通常在万人以内,人脸比对的反应时间通常在秒级,应用场景既涉及室内均匀光线又涉及到室外或建筑出入口的日光或强反差的光线情况。企业级人脸门禁是当前市场增长最迅猛的人脸门禁产品领域。
第五级:行业级
在公共安全、公共交通、大型园区、大型演唱会或展览活动等进行人脸识别比对或者公共安全的应用时,往往需要具有行业级人脸识别技术的产品。应用环境通常在室外牙大型建筑的多个出入口,设备需要联网分布式运行,用于解决数万甚至数十万人的智能通行需求。
第六级:金融级
人脸识别的生物精度的理论水平在万分之一的误差之内,但是金融支付通常要求系统的精度误差在百万分之一甚至更低水平,用于保障金融安全的人脸识别产品技术称为金融级安全的技术。目前来看人脸识别在金融支付领域还面临不少挑战有待克服。
总结:人脸识别的产品分为不同的技术成熟度等级,分别适应于不同的应用领域。从目前来看,人脸门禁正从消费级人脸门禁向企业级、行业级甚至金融级安全的人脸门禁的发展历程中。当前比较成熟的是用于万人库的企业级人脸门禁产品,也有少数数万人脸库的行业级产品已经开始出现。
第三篇 产品的主要功能
人脸门禁产品的主要功能包括人脸成像采集、人脸图像特征提取及人脸库比对管理、报警联动数据分析几个功能模块。每种功能模块涉及不同的业务特点。
人脸成像采集
不同的人脸图像通过摄像镜头采集得到,比如静态图像、动态图像、不同的位置、不同表情等,当采集对象在设备的拍摄范围内时,采集设备会自动搜索并拍摄人脸图像。影响人脸成像采集的主要因素是摄像头的性能指标和摄像头安装部署位置等因素。通常情况下人像采集涉及如下因素:
图像大小。人脸图像过小会影响识别效果,人脸图像过大会影响识别速度。图像大小一定程度上在实际应用场景是人脸离摄像头的距离。
图像分辨率。越低的图像分辨率越难识别。图像大小综合图像分辨率,直接影响摄像头识别距离。
光照环境。摄像头成像需要一定的光照范围,过曝或过暗的光照环境都会影响人脸识别效果。这是影响人脸识别最重要的因素之一。通常可以采用自然补光和外部人工补光的方式来解决光照问题。
模糊程度。人脸相对于摄像头的移动经常会产生运动模糊,导致影响检测和识别效果。
遮挡程度。五官无遮挡、脸部边缘清晰的图像为最佳。而在实际场景中,很多人脸都会被帽子、眼镜、口罩等遮挡物遮挡。
采集角度。人脸相对于摄像头角度为正脸最佳。但实际场景中往往很难抓拍正脸,会涉及到人脸与摄像头之间多少角度适宜于人脸采集的进行。
摄像机成像的几种参数
1.摄像头成像分辨率
人像采集的摄像头通常分为USB摄像头、MIPI摄像头和网络摄像头。其中USB和MIPI通常传输未经压缩的视频数据一般用于设备内近距离传输,网络摄像头通常传输压缩后的视频数据可以用于设备间的远距离传输。以下以网络摄像头为例描述摄像头的成像分辨率。
720p。720P实际是指分辨率1280×720像素。计算一下就是1280×720=921600像素,720p或720i为百万像素分辨率,通常指百万网络摄像机。720P每路默认图像码流为3M,具体的速率和视频压缩的比率也高度相关。
960p。960P实际是指分辨率1280×960像素。计算一下就是1280×960=1228800像素,一般都会叫960p或960i为130万像素分辨率,通常指130万像素的摄像机。960P每路默认图像码流为4M,具体的速率和视频压缩的比率也高度相关。
1080p。1080P实际是指分辨率1920×1080像素。计算一下就是1920×1080=2073600像素,一般都会叫 1080p或1080i为200万像素分辨率,通常指200万像素的摄像机。1080P每路默认图像码流为5M,具体的速率和视频压缩的比率也高度相关。
4K。4K指的是3840水平×2160垂直(16:9)像素的分辨率,支持120p、60p、59.94p、50p、30p、29.97p、25p、24p和23.976p,共9种帧率。4K每路默认图像码流为8M以上,具体的速率和视频压缩的比率也高度相关。
2.光照强度
人脸若要被摄像机成像,首要条件是人脸接受到一定程度的光线即受到足够的光照强度。光照强度的标准属于是照度,照度是反映光照强度的一种单位,其物理意义是照射到单位面积上的光通量,照度的单位是每平方米的流明(Lm)数,也叫做勒克斯(Lux):1Lux=1Lm/平方米。上式中,Lm是光通量的单位,其定义是纯铂在熔化温度(约1770℃)时,其1/60平方米的表面面积于1球面度的立体角内所辐射的光量。
人脸检测要求人脸接受的光既不能太强也不能太弱,通常需要10-3000lux之间的亮度比较适宜,过亮或者过暗都能导致摄像杨对人脸成像效果的差异。
3.宽动态
当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像机输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。摄像机在同一场景中对最亮区域及较暗区域的表现是存在局限的,这种局限就是通常所讲的“动态范围”。
宽动态(WDR)技术是在非常强烈的对比下让摄像机看到影像的特色而运用的一种技术。WDR是Wide Dynamic Range 的缩写,意思是宽动态范围。当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像机输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。摄像机在同一场景中对最亮区域及较暗区域的表现是存在局限的,这种局限就是通常所讲的“动态范围”。
宽动态范围是图像能分辨最亮的亮度信号值与能分辨的最暗的亮光信号值的比值。宽动态的表现方式以“倍数”或“dB”来表示。
宽动态最常见的形式是使用多次曝光方法,该方法包括捕获短时间内的两帧图像和一个长曝光速度。第一次曝光捕捉明亮区域场景中的细节,而后者则捕获场景中的暗部区域的细节。然后将两个图像组合在一起,可以在同时呈现明亮和黑暗区域两个图像细节。通常的宽动态范围介于50~70dB之间,更高性能的宽动态范围从100~130dB之间。最先进的宽动态范围(又被称为第三代宽动态)被叫做"真WDR",通过捕获四个帧图像进行比较,以达到最佳效果。相较于之前的两帧宽动态范围技术来说,帧数量的增加有助于解决图像中前景和背景之间的照明差异。
4.人脸成像角度
人脸成像的角度对应是人脸和镜头之间的三种角度:上下翻转pitch,左右翻转yaw,平面内旋转roll的角度。最理想情况下,摄像头与人脸之间的三种角度是:
上下翻转pitch:摄像头成像位置与人脸位置同高,这样上下翻转角度几乎为0。
左右翻转yaw:人脸正对摄像头,左右翻转角度在0-15度之间。
平面内旋转roll:人脸与摄像头的重力线相同,不涉及到脸的平面旋转。
但真实的摄像机成像时往往涉及到摄像头安装位置与人像的真实角度等问题,导致摄像机无法接近理想情况成像。
5.白平衡
在任意色温条件下,摄像机镜头所拍摄的标准白色经过电路的调整,使之成像后仍然为白色,使被拍摄到的图像的色彩能够精确的被反映出来,这样的过程称为白平衡。
白平衡(White Balance)只用于彩色摄像机,其用途是实现摄像机图像能精确反映景物状况,有手动白平衡和自动白平衡两种方式。
自动白平衡
连续方式:此时白平衡设置将随着景物色彩温度的改变而连续地调整,范围为2800~6000K。这种方式对于景物的色彩温度在拍摄期间不断改变的场合是最适宜的,使色彩表现自然,但对于景物中很少甚至没有白色时,连续的白平衡不能产生最佳的彩色效果。
按钮方式:先将摄像机对准诸如白墙、白纸等白色目标,然后将自动方式开关从手动拨到设置位置,保留在该位置几秒钟或者至图像呈现白色为止,在白平衡被执行后,将自动方式开关拨回手动位置以锁定该白平衡的设置,此时白平衡设置将保持在摄像机的存储器中,直至再次执行被改变为止,其范围为2300~10000K,在此期间,即使摄像机断电也不会丢失该设置。以按钮方式设置白平衡最为精确和可靠,适用于大部分应用场合。
手动白平衡
开手动白平衡将关闭自动白平衡,此时改变图像的红色或蓝色状况有多达107个等级供调节,如增加或减少红色各一个等级、增加或减少蓝色各一个等级。除次之外,有的摄像机还有将白平衡固定在3200K(白炽灯水平)和5500K(日光水平)等档次命令。
摄像机人脸成像的关键关系在于:视频或图片画面中“人脸”区域要有足够的成像光线、成像大小和成像的真实还原性例如无变形和白平衡等。
无论采用任何种类的摄像头,如果要进行有效的人脸成像,在整个画面中理想的人脸部分画面对应的典型参数是:
人脸检测性能
在静态画面和动态视频检测人脸的主要指标是处理一张照片人脸检测所需要花费的时间。衡量人脸检测结果通常需要几个指标:
1.输入画面大小
视频图像通常涉及CIF、D1、720P、1080P、2K、4K及以上等不同视频分辨率。
通常用于人脸识别的视频分辨率为720P和1080P。
2.检测速度
对指定分辨率图片完成一次人脸检测所需要的时间,直接的指标是人脸识别图像的处理帧率。
通常在1080P视频下要求每秒能完成10帧以上的视频检测,即相当于每100ms要完成一帧画面的人像检测。
3.检测数量
指在同一张视频图片中出现人人脸数量,和人脸抓拍的应用环境高度相关。人脸和比对环境下通常每个画面中只有1个人出现。人脸门禁、人脸通行环境要求每个画面能处理5个人脸。公共交通如车站、广场等通常要求每个画面处理多达30-50个人脸。
4.检测精度
指在画面出现多个人脸时算法能够检测出人脸的数量与真实人脸数量的差距。
总结:人脸检测通常和设备的应用场景相关度较大,如嵌入式设备比如人脸锁或门禁、智能硬件往往只要求同一画面只做一个人脸的识别;智能建筑门禁通行或会场签到在同一画面往往要求3-10人的人脸检测;商场、车站或室外布控有时候需要同一画面实现10-50人的人脸检测处理。
活体判定
1.配合型活体检测
通常要求被检测的对象面对摄像机通过眨眼、张嘴、摇头、点头等组合动作,或者通过阅读指定数字或者词语,确保操作的为真实活体人脸。
2.无配合自然型活体检测
非配合式活体检测,不需要用户做任何动作,依靠摄像头在一定时间内抓取到人脸进行相关的算法判断是否是活体,避免利用照片、视频等非活体投机行为。
活体识别技术一直是人脸识别的一个技术重点,人脸活体识别技术和与之对抗的人脸活体欺诈技术都在迅猛发展,相当于矛和盾的关系。
人员注册管理
人脸门禁往往要求衔建立比对人员名单的人员库,这个过程称为人员注册。人员注册一般要求提供人员的基本信息如ID信息、姓名、所关联的权限区域、以及最关键的要提供人脸比对质量要求的清晰照片。人脸注册可以采用自助注册或者管理员批量处理的方式完成。
人脸特征提取和人脸库管理比对
1.人脸特征提取
人脸识别的一个关键环节就是把从视频图片里检测到的人脸照片通过深度学习或者其它的方法转型成一定的数据结构,这个过程称为人脸特征化。对一张人脸照片经过特征化以后往往形成128维的矩阵或者不同的特征向量,然后对代表人脸的特征向量进行存储管理、比对管理、检索管理等。
人脸识别的特征提取分为几种技术过程:
几何特征。从面部点之间的距离和比率作为特征,识别速度快,内存要求比较小,对于光照敏感度降低。
基于模型特征。根据不同特征状态所具有概率不同而提取人脸图像特征。
基于统计特征。将人脸图像视为随机向量,并用统计方法辨别不同人脸特征模式,比较典型的有特征脸、独立成分分析、奇异值分解等。
基于神经网络特征。利用大量神经单元对人脸图像特征进行联想存储和记忆,根据不同神经单元状态的概率实现对人脸图像准确识别。
当前比较主流的是基于神经网络的特征提取方法 。
2.人脸库比对和管理
根据实际应用的场景不同,人脸库可以分为以下几种容量:
100人以内超小规模人脸库。主要用于个人、家庭或者中小企业环境,用于人脸门锁、人脸智能柜、中小企业人脸考勤等。
2000人以内小规模人脸库。主要用于小型企业或社区单元楼的人脸门禁等应用。
20000人以内中等规模人脸库。主要应用于中型企业、社区或者会场的人脸门禁、人脸签到等应用。
50000人以内大规模人脸库。用于大型企业、园区、社区的人脸门禁或大型活动应用。
50000人以上大规模人脸库。主要用于公安布控或者更大规模的人脸比对场景。
报警联动及数据分析
人脸门禁应用中,当完成人脸检测、人脸比对分析以后,通常涉及到人脸联动处理。按照对联动处理的响应速度,一般分为如下几种类型:
1.实时联动
人脸检测、人脸比对和结果的联动能够满足每秒完成5-10帧以上,普通人通常感觉不到人脸识别的延时过程,这种应用称为实时联动。
实时联动通常要求整体的处理时间在0.2秒内完成。
实时联动通常用于人脸自然通行或者会场签到等场景。
2.秒级联动
人脸门禁从接触到处理完成整个时间在1秒左右完成,普通人感受到延时但是可接受的状态。
秒级联动是人脸门禁主要的应用需求,应用于各类园区、建筑或者办公室门禁场所。
3.延时联动
如果从人脸出现到整体联动完成需要1秒以上的处理时间,通常称为延时联动。延时的大小和应用场景相关。比如商场零售的会员分析统计或者课堂的人脸签到经常要求在分钟级响应。
总结:人脸门禁的主要功能涉及:人脸检测采集、人员注册、人脸库管理和联动报警及数据分析。功能的实现往往涉及到不同的应用场景和产品形态的实现。通常来讲实现这些功能越有效、越便捷、越高的性价比,意味着更大的用户满意度。
第四篇 人脸门禁产品形态
组合型设备
实现人脸门禁的完整功能如果需要多个设备组合进行,就称为组合型人脸门禁设备。典型的人脸门禁组合型设备涉及以下几个部分:
人脸门禁的组成
摄像机用于采集视频信息,主机用于运行人脸识别、人脸库管理和注册服务的软件,客户端用于用户交互。几个设备之间通过网络进行连接。
组合型人脸门禁的典型设备是常见的监控摄像头和计算机主机组成,这些设备通常用于大型人脸库管理。组合型人脸门禁的优势是设备性能比较高,缺点是组网实施比较复杂导致系统可靠度低或者维护工作量大。
一体化设备
一体化人脸门禁设备是指人脸识别和比对通常在同一个设备内完成,不需要额外设备的配合。常见的一体化人脸门禁设备分为带屏幕的一体化门禁设备和不带屏幕的一体化人脸门禁设备。目前人脸门禁设备以一体化设备的占有率和增长速度最快。
1.带屏幕一体化人脸门禁设备
设备直接集成摄像头、屏幕、计算主板、联动报警等,在单个设备完成人脸采集、人脸注册、建库比对、联动门禁等功能。
2.不带屏幕人脸门禁设备
设备直接集成摄像头、计算主板、联动报警等,在单个设备完成人脸采集、人脸注册、建库比对、联动门禁等功能,但是不带屏幕输出,可以通过声光信号进行门禁联动。
联网型设备
1.局域联网
门禁设备之内通过局域网进行多台设备的联网管理,可以实现统一的用户注册、人脸库管理和权限管理等,称为局域网联网设备或称企业内网型联网。
2.互联网云联网
门禁设备之间如果通过互联网进行分布式的管理,客户端通过手机或电脑进行远程的管理,称为互联网云联网的门禁系统。
总结:人脸门禁的产品形态分为组合型产品、一体化产品,目前人脸门禁的主要产品为一体化门禁产品。一体化人脸门禁产品又通常以带屏幕的一体化人脸门禁产品为主,未来人脸门禁摄像机类型的产品也将有很大的成长空间。人脸门禁的组网分为企业内部的局域网产品和基于互联网的云联网产品为主。局域网人脸门禁组网通常为企业自己组建管理服务器和统一的集中管理端进行设备的管理。基于互联网的云联网人脸门禁是基于在互联网上的服务器进行互联网联网的设备管理,客户端既有电脑这样的传统设备,又可以采用手机移动客户端进行管理。
注:文章转载自公众号:AI智道,作者:纽豪斯