工业自动化离不开感知技术和运动控制技术,就像人离不开眼睛和大脑,可想而知,视觉感知技术一定是工业自动化领域最重要的技术之一。而深度学习可谓是视觉感知技术中的“黑马”,它的应用使机器视觉在很多场景下超越现有解决方案,并能够胜任更具挑战性的任务,因此近年来在工业视觉领域掀起应用热潮。
工业自动化趋势下的一匹“黑马”
机器视觉作为一种基于2D或3D相机传感器的工业自动化技术,在工业视觉领域具有广泛而成熟的应用,如字符识别、质量检测、产品测量等。而在众多的应用场景中,机器视觉系统要完成任务必须对工业相机等硬件设备生成的待检测产品的图像进行分类。在深度学习还未在工业领域广泛应用前,这一环节通常是由工程师编写相应算法提取图像特征来实现,也就是常说的传统计算机视觉技术。
在使用传统视觉技术进行图像分类时,需要用到特征提取步骤,特征即图像中描述性或信息性的小图像块。要完成这一步,工程师需要运用多种算法,如边缘检测算法、角点检测算法、阈值分割算法等等。从图像中提取出足够多的特征后,根据这些特征形成每个目标类别的定义,即“词袋”。再与其它图像中所提取的特征相对比,如果在一张图像中找到了另一张图像词袋中的绝大多数特征,则该图像包含同样的目标。
这类算法时至今日的应用性依然很广泛,但其硬伤在于必须选择需要查找图像中的哪些特征。而当图像中存在很多个类别时,就会变得复杂难以分类,只有使用不同的特征才可以更好地描述不同类别的对象。但如果使用很多特征,就必须对大量的参数进行微调。这一繁复的工作需要消耗大量工时。因此,传统机器视觉技术只适用于模型匹配、测量、字符识别等一些简单的应用场景。
随着工业自动化水平的要求不断提高,传统机器视觉已无法适用当下随机性强、特征复杂的工业检测任务。面对一些具有复杂特征的产品图像检测,如缺陷种类多、类别多样、大小不一等,传统机器视觉技术爱莫能助,但深度学习技术却可以一展身手。
“深度学习以系统神经网络为基础,不再通过算法来搜索特定特征,而是训练深度学习系统内的神经网络,通过学习各零部件的形态特征,建立包含零部件特征的深度学习模型,能够快速定位识别不同组件,具有可重复性和可扩展性。”专注于机器视觉技术研发的浙江深眸科技有限公司的技术专家说道。
相较于传统机器视觉解决方案,深度学习的又一大优点在于可以缩短项目技术的研发时间。通常情况下,大多数机器视觉应用程序需要两个月时间来进行软件开发和可行性测试,而采用集合了多种深度学习算法的机器视觉软件开发平台则只需要十分钟,如深眸科技自主研发的轻辙视觉引擎,以深度学习算法为核心,企业只需投入一位开发人员即可在短时间内完成项目部署。
运用深度学习算法,企业能够大幅压缩项目开发的时间成本和人工成本,加之适用于众多使用场景,短短数年,深度学习已经在众多领域击败传统算法,成为工业领域主流应用的图像分类处理方法。
深度学习如何解决复杂特征问题?
深度学习给计算机视觉和人工智能领域带来了革命性突破,在图像分析上,许多曾经对于传统计算机视觉来说的棘手难题,现在深度学习可以解决的比人类识别效果还要优秀。
究其原因,很大程度上是因为深度学习引入了“端到端学习”这一概念。简而言之,就是让机器在每个特定类别的对象中学习寻找最具描述性、最突出的特征,继而让神经网络自己去发现各种类型图像中的潜在模式。基于此,工程师不再需要手动决定采用哪种传统算法来描述特征,只需要“喂”给深度学习算法足够多的图像。
深眸科技的技术专家这样解释“如果你想教会一个深度神经网络识别一只猫,你不必告诉它去寻找猫的眼睛、毛发、四肢等特征,只需要把成千上万张猫的图像展示给它,它自己就能解决。如果它总是把狐狸当成猫,也不需要重新编写代码,继续进行训练就行了。”
举个例子,深眸科技在为一家大型家电生产商提供配件防错漏检测解决方案中。在检测过程中,由于家电配件种类多,组合随机性较大,且不同零件在结构、颜色、材质上有较大差异,还有可能存在遮挡、背景同色等干扰。这种情况,传统计算机视觉算法难以应对自如,但深度学习算法经过大量训练已经形成包含各配件特征的深度学习模型,可以轻松应对上述复杂情况,且识别准确率高达99.9%。
随着我国制造业的不断发展壮大,各大生产企业急需更智能、准确和可重复的视觉检测系统。需求的驱动以及准确度高、应用场景广泛等优势加持,可以预见,在医疗、食品、半导体等行业,深度学习算法都将有光明的应用前景。需要注意的是,深度学习虽有众多优势,但这并不意味着传统计算机视觉算法的没落,在不同应用领域,传统算法和深度学习各有优势,强强联手才能更好的赋能工业检测。