杭电自动化学院博一学生郑锦凯的一项研究成果,通过可迁移邻域发现算法,在跨域场景下的步态识别精度上,大大超过了目前普遍使用的聚类赋伪标签识别方法,有望在刑侦破案、寻找丢失儿童等领域一显身手。
郑锦凯的论文名为《TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain Gait Recognition》,发表在不久前召开的ISCAS(IEEE International Symposium on Circuits and Systems)这一国际学术会议上,并在IEEE 多媒体系统与应用技术专委会(IEEE MSA-TC)年度会议上做口头报告,荣获2021年度IEEE MSA-TC最佳论文提名奖(2021 MSA-TC Best Paper Award - Honorable Mention)。
据了解,目前普遍使用的深度学习算法依赖数据标注,换言之,通过步态识别谁是谁,首先得在数据库里知道具体的步态是怎样的。这意味着,标注的准确性和数量直接影响着最终的识别精度。在实际应用中,人们往往受限于这种既昂贵又费时费力的数据标注上。如果数据库里没有具体人的标注数据,那怎么办?
为此,郑锦凯提出可迁移邻域发现算法,首先找出高置信度样本,并通过最近邻算法找出这些样本的领域样本,之后通过损失函数拉近高置信度样本与其领域样本在特征空间中的距离,采用从易到难、循序渐进的方式更新深度学习模型。整个过程由近到远、由易到难、由已知到未知,逐渐识别“哪些步态是谁的”,从而锁定目标人物。
什么是可迁移邻域发现算法?郑锦凯打了个比方:“如果想让一个小孩识别国内的动物种类,你会给他一些动物图片和对应的动物名字。通过学习,小孩能认出许多动物。你可能觉得还不够,希望小孩能识别国外的动物,于是给小孩一些国外动物的图片,让他把属于同一物种的图片都放到一起进行分类。”
郑锦凯进一步解释道,由于小孩之前学习了很多国内的动物,一开始会比较顺利,能够挑选出一张或者几张长得最像老虎的放一组、像狮子的放一组,等等。接着,小孩可能会继续寻找那些还长得比较像老虎、狮子等的图片,直到他再也找不到自己学过的图片之后,他发现剩余那些之前没见过的图片里,有好几张长得很类似,于是猜测它们属于一个新物种。小孩可能同时发现好几个新物种,把它们分别放一组,接着继续寻找和这些新物种长得很像的图片。
“可迁移邻域发现算法模拟了上述一过程,直到所有图片都被找完为止。”郑锦凯说,“可迁移邻域发现算法与传统聚类赋伪标签识别不一样,有望在步态识别领域拓展新的应用。
郑锦凯来自杭电自动化学院智能信息处理实验室,该实验室由颜成钢教授领衔,与美国北卡罗来纳大学教堂山分校、中国科学院、清华大学、京东AI研究院等国内外多家科研院所有长期密切的合作,近年来培养出多名优秀学生,多人多次在国际重要学术会议上获得最佳论文奖。郑锦凯是智能信息处理实验室培养的第四位硕博连读研究生,导师为张继勇教授。