在针对的目标市场方向,阿里云表示图像识别分为生物识别、物体与场景识别、视频识别等,预计2020年的总市场规模将达到数百亿美元,应用领域包括金融、安防、医疗、自动驾驶、手机、工业、娱乐图片、媒资等。
阿里云认为,对于手机厂商和图片娱乐业来说,行业现状为没有相关的技术储备或储备不足,核心需求包括人脸AR、智能相册管理、图片安全监控等,阿里云的价值在于高性能底层核心算法;对于金融行业和安全监控行业来说,行业现状为人工图像辨别的成本高、支付安全性低,核心需求包括身份识别、人脸支付、敏感图片识别、客户行为分析等,阿里云的价值在于降低人工成本、实现智能识别、提高识别准确率、增强安全性等;对于电子商务行业来说,行业现状为购物场景和体验单一、人工图片监控力度弱,核心需求为试妆试戴、电商图像分析、电商图像检索等,阿里云的价值为丰富购物体验与购物场景、增强图片安全性等。
与电商、搜索和存储等紧密结合,阿里云一站式视觉产品服务生态平台的商业模式为标准化产品收费、定制化方案项目收费、SDK收费以及共建分成等方式。阿里云方面表示,其图像识别服务面向全球市场,目标客户包括了行业客户和行业ISV等。
车辆检测刷新KITTI的新纪录
在一个月前的5月18日,阿里云的智能视觉识别算法刷新了全球权威机器视觉算法测评平台KITTI的新纪录,将该测评的车辆检测准确率拉升至90.46%。在车辆检测这一竞赛项目上,要求参赛计算机视觉算法能检测出由车载相机所拍摄的车辆以及估算车头朝向。该测试包含7千多张训练图像和7千多张测试图像,单张图像上有车辆遮挡等真实场景,检测挑战相当大。本次技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成,他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角、多姿态以及车辆遮挡等问题。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。
华先胜在云栖大会·上海峰会上表示,当天发布的“图像识别”和“人脸识别”两项服务仅是阿里云的智能视觉服务中的一部分技术,阿里云已将智能视觉技术集成到阿里云ET当中,阿里云ET的人脸识别技术已经实现了人脸检测、器官轮廓定位、1对1人脸认证和1对多人脸识别等多个功能。阿里云的视觉识别服务还包括视频分析、视觉设计、工业诊断、医疗诊断等,将陆续推向市场。
此外,阿里云的智能视觉识别服务还已经在城市大脑中落地。城市大脑是包括阿里云在内的13家企业联合杭州市政府发起的项目,旨在构建一个城市级的人工智能中枢,其中分析视频是城市大脑获取信息的关键。以交通治理为例,城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹,对这些数据进行实时分析,并基于此进行多种智能交通优化。