近年来,随着集约化管理与精确测量的要求,更有效地进行牲畜识别管理(如体重、健康等)的客观测量已经成为紧迫的问题。在当下,最佳的实践为RFID标签方案,但对于农民或者管理人员而言,这个方案不仅耗时与成本高,而且也让动物难以适应,人脸识别技术的发展,让人们看到非接触式识别的方便性,因此便有不少人提出了通过动物的面部进行非接触式识别的方案。
在国外也有不少专家对于牲畜识别的可行性进行了一番研究,本文根据Mark F. Hansen等人《利用卷积神经网络进行农场猪脸识别》的文章谈谈牲畜识别存在的困难及可行性分析。
从几何特征识别到整体匹配,人类对于人脸识别的研究已经超过了五十年,随着深度学习算法与最新的识别技术相互结合,才能实现接近甚至超越人类的水平。但是在相关牲畜的识别,如关于牛、猪、羊、犬等识别及行为分析的研究仍然不多,虽然当下也有一些不错的报告数据(如对鼻子与眼睛等小区域的识别)结果较为不错,但终究是经过人手动分割裁剪的“脸”,在实验室之外很难落地。如何在自然条件下对农场的牲畜进行数据采集,从而进行数据集训练完成学习都具有一定的挑战性。
(1)数据的采集
保证清晰且光线好的正脸图像,是面部识别应用的基础。对于用户而言,利用现有的网络摄像头完成牲畜“脸”的采集是最为方便的,但现实中,一是摄像机要应对环境的挑战,光照、高度、环境等等都会造成识别的困难,二是牲畜的配合意愿要远远低于人类,舔、转身避开、破坏摄像头等状况时有发生。
更让人无奈的是,动物面部识别需要数百个参考点(远多于人脸),才能获得达到与人脸识别同等水平的算法。在报告中,Mark F. Hansen等人采取的是在饮水器安装摄像头,借而在他们自愿接近时,完成抓拍。
在国内也有厂商采取更直接的方式,让摄影师去抓拍猪们的相片,为了让结果更加精准,除了正面照外也要添加动物的侧面照,因为相对于人类而言,动物的侧脸更具辨识度,甚至可以根据眼的倾斜角度与嘴部形状进行区分它们。
(2)数据清理
为了避免连续帧之间低方差的缺点,在报告中,Mark F. Hansen等人采用了结构相似性指数测量(SSIM)来测量图像之间的相似性。这种方法试图更接近人类的感知,而不是替代和常用的均方误差(MSE)测量报告图像之间的相似性。它考虑了方差、协方差和平均强度在两个图像,x和y,情商所示。其中,μx,μy是平均值,σx,σy是方差,σxy是图像x和y的协方差。c1,c2是常数,以避免分母接近零时的不稳定性,将每个图像与后续图像进行比较,直到找到足够的差异。
(3)讨论
在报告中,虽然仅仅针对的是10只猪,并最终得到78.4%的准确率(指正确的识别图像占据整个数集的百分比),这也意味着在一个不约束的场景中,准确识别出猪的个体是存在可能性的,经过不断训练的数据,将会提升准确率。
在国内正在做牲畜识别的厂商也不少,例如广州影子科技推出猪的脸部识别与身份识别服务等,但目前以猪的识别为例,仍然需要克服不少困难:
一是猪的生长导致体型及面部的变化,要远远比人脸大,而且品种较多,这意味着需要积累不同品种的猪在生长过程中变化数据;
二是相对于其他的成熟的技术,猪脸识别仍需要实践去证明。目前识别猪最好的方案是耳标或植入芯片,虽然有不少人反对这种方式是在伤害牲畜,但无论是猪脸识别还是戴上耳标,猪都无法摆脱痛苦死去的命运,站在技术的角度而言,猪脸识别仍然受到质疑。
在京东举办的“猪脸识别”比赛中,冠军团队采用的是迁移学习的体系,传统的人工智能技术来实现视觉识别的原理利用计算机神经网络的深度学习,学到每一头猪的特征,然后利用深度学习的模型 ,针对测试数据集,得到每一头猪的概率,最后来判别哪头猪是哪头猪。而迁移学习不抛弃从之前数据里得到的有用信息,同时应对新进来的大量数据的缺少标签或者由于数据更新而导致的标签变异情况。该团队表示刚拿到数据集时,很难分辨哪头猪是哪头。而当他们使用模型再运行数据,发现猪脸识别的最后运行效果达到比模型跑人脸的效果还好。
采用迁移学习识别算是开启了一种全新的思路,先找到一个人脸和动物脸相似性较大的一个映射空间,然后使得人脸的训练数据可以被有效的利用起来训练动物脸的识别。但无论如何在牲畜识别上,可能要走的路要比人脸要艰难与长久得多。
(本文部分观点与数据来源于CDSN与国外媒体报道)