继神经网络推理框架ncnn、TNN,动作检测算法DBG,通用目标检测算法OSD,人脸检测算法DSFD、人脸属性算法FAN等众多优秀的框架、算法开源后,腾讯优图实验室又有一项人脸识别算法研究项目——TFace正式拥抱开源。
项目背景
TFace是由腾讯优图实验室研发的人脸识别算法研究项目,其中TFace中的T意为“trusty”,表达了团队在可信人脸识别技术方向上的愿景。
人脸识别算法是指在检测到人脸并定位面部关键特征点之后,裁剪出主要的人脸区域,并经过预处理后馈入后端的识别算法。因为有着方便友好、易于接受、不易伪造等一系列优点,在过去30多年里,人脸识别一直都是人工智能领域的研究热点。并被广泛应用在公共安全、身份验证、门禁考勤、金融支付等领域。随着人脸识别技术的大规模应用,进入“看脸时代”的同时,人脸识别也正在一步步向着“可信”发展。
基于可信人脸识别的理念,TFace重点关注人脸识别领域的四个研究方向:精准、公平、可解释以及隐私。经过多年的行业实战经验,优图在每个方向都积累了大量硬核技术,其中很多提炼后作为学术成果发表在相关顶级CV会议中。为了方便研究人员快速复现我们的工作,已发表文章的代码全部在TFace中开源;
在研究工作开展的过程中,我们开发了一套成熟的算法训练和测试框架,框架主要由数据增强、骨干网络模型库、模型评估、训练范式等高度抽象化模块组成,通过简单的修改配置文件就可以开展相应的实验,支持多种骨干网络结构和heads,复现了学术界主流的SOTA方法和效果,同时也利用工业界主流的推理框架测试了不同模型的推理耗时。
1、在数据预增强模块中,除了传统的图像处理操作外,针对困难场景下识别精度低这一难题,TFace采用从2D和3D两条路线进行数据增强,目前已开放2D数据增强代码,可以扩增成戴口罩、戴眼镜、戴头巾等样本,后续TFace也会逐渐开放对于光线、表情、姿态这些细粒度属性的3D增强代码;
2、在骨干网络模型库中,TFace实现了十余种学术界常见的人脸识别提特征网络结构,可以满足终端和后台等常用场景下的耗时需求;
3、模型评估模块主要包括了推理耗时评估和精度评估,推理耗时评估主要测试了不同模型在X86 CPU,ARM CPU,GPU具体设备上的推理速度,精度评估主要提供了在常见学术测试集上的评估工具以及不同模型的结果,这些可以供开发者选择模型结构时参考;
4、在训练范式上,TFace支持常见的数据并行+模型并行以及混合精度训练,提升大规模训练的效率,支持多数据分支训练,采用类似多任务学习的方式同时训练多个数据集,提升模型的精度,此外TFace后续将会开放量化感知训练、模型蒸馏、联邦训练等代码。
算法介绍(CurricularFace)
一种用于人脸识别基础模型训练的损失函数,发表于CVPR2020,主要的思路是将课程学习的思想结合到常用的人脸识别损失函数,训练过程中自动挖掘困难样本,先易后难渐进学习,提升识别模型训练鲁棒性及难样本识别性能。
DDL
一种用于提升特定场景下人脸识别性能的方法,发表于ECCV2020,主要的思路是针对某一特定场景的难样本,为其寻找一个合适的教师场景,通过拉近两种场景下的人脸相似度分布,从而提升该场景下困难样本的识别性能。
CIFP
提升个体识别公平性的方法,发表于CVPR2021,提出了基于误报率惩罚的损失函数,即通过增加实例误报率(FPR)的一致性来减轻人脸识别偏差。
SDD-FIQA
一种基于人脸识别相似度分布的无监督人脸质量评估方法,发表于CVPR2021,通过计算同人和非同人相似度分布的韦氏距离作为目标图像的质量分伪标签,最终通过图像+质量伪标签训练得到质量分模型。
SCF
一种基于人脸特征置信度的人脸识别方法,发表于CVPR2021,核心思想包含两点:a.将人脸样本特征从确定向量升级为概率分布,从而获得额外刻画样本识别置信度的能力;b.提出适配于超球流形r-radius von Mises Fisher分布建模特征,理论可解释性与方法收敛性较PFE更佳。
目前,TFace项目中的算法能力已应用在内外多个业务中,对内广泛支撑了腾讯内部如微信,QQ中的身份识别需求,对外则通过腾讯云服务的形式,提供了ToC、ToB的相关能力,典型应用案例如跨年龄寻人、人脸核身、刷脸支付等。现在,TFace已在GitHub(https://github.com/Tencent/TFace)上正式开源。