阿里云的智能视觉识别“生意经”，打算这么念

钛媒体 • 7年前扫码分享

阿里云在2017年6月10日的云栖大会·上海峰会上，正式发布了“图像识别”和“人脸识别”两项视觉智能服务。

视觉计算是阿里巴巴“NASA”计划的一部分，“NASA”计划聚焦于机器学习、芯片、IoT、操作系统、生物识别等核心技术领域，希望解决10年、20年后的挑战。虽然着眼于解决10年、20年后的挑战，但每新推出一项智能服务，阿里云都有一本自己的生意经。

智能视觉识别的生意经

在针对的目标市场方向，阿里云表示图像识别分为生物识别、物体与场景识别、视频识别等，预计2020年的总市场规模将达到数百亿美元，应用领域包括金融、安防、医疗、自动驾驶、手机、工业、娱乐图片、媒资等。

阿里云强调了其对于三大领域的价值——图片娱乐、金融和安全监控以及电子商务行业：

对于手机厂商和图片娱乐业来说，行业现状为没有相关的技术储备或储备不足，核心需求包括人脸AR、智能相册管理、图片安全监控等，阿里云的价值在于高性能底层核心算法；对于金融行业和安全监控行业来说，行业现状为人工图像辨别的成本高、支付安全性低，核心需求包括身份识别、人脸支付、敏感图片识别、客户行为分析等，阿里云的价值在于降低人工成本、实现智能识别、提高识别准确率、增强安全性等；对于电子商务行业来说，行业现状为购物场景和体验单一、人工图片监控力度弱，核心需求为试妆试戴、电商图像分析、电商图像检索等，阿里云的价值为丰富购物体验与购物场景、增强图片安全性等。

与电商、搜索和存储等紧密结合，阿里云一站式视觉产品服务生态平台的商业模式为标准化产品收费、定制化方案项目收费、SDK收费以及共建分成等方式。阿里云方面表示，其图像识别服务面向全球市场，目标客户包括了行业客户和行业ISV等。

刷新国际大赛纪录

在一个月前的5月18日，阿里云的智能视觉识别算法刷新了全球权威机器视觉算法测评平台KITTI的新纪录，将该测评的车辆检测准确率拉升至90.46%。

KITTI是德国卡尔斯鲁厄理工学院（Karlsruhe Institute of Technology）和芝加哥丰田技术研究所联合创办、目前国际上最大的自动驾驶场景下计算机视觉算法评测数据集，可以用于评测目标（机动车、非机动车、行人等）检测、目标跟踪等计算机视觉技术在复杂真实环境下的性能。

在车辆检测这一竞赛项目上，要求参赛计算机视觉算法能检测出由车载相机所拍摄的车辆以及估算车头朝向。该测试包含7千多张训练图像和7千多张测试图像，单张图像上有车辆遮挡等真实场景，检测挑战相当大。

本次技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成，他们提出了基于区域融合决策和上下文相关的多任务深度神经网络，用于复杂场景下的车辆检测任务，重点解决其中多视角、多姿态以及车辆遮挡等问题。在训练过程中，还借鉴了GAN（生成对抗网络）中的对抗训练模式。

华先胜在云栖大会·上海峰会上表示，当天发布的“图像识别”和“人脸识别”两项服务仅是阿里云的智能视觉服务中的一部分技术，在云上已经过很长时间的测试。

华先胜表示已将智能视觉技术集成到阿里云ET当中，阿里云ET的人脸识别技术已经实现了人脸检测、器官轮廓定位、1对1人脸认证和1对多人脸识别等多个功能。阿里云的视觉识别服务还包括视频分析、视觉设计、工业诊断、医疗诊断等，将陆续推向市场。

此外，阿里云的智能视觉识别服务还已经在城市大脑中落地。城市大脑是包括阿里云在内的13家企业联合杭州市政府发起的项目，旨在构建一个城市级的人工智能中枢，其中分析视频是城市大脑获取信息的关键。以交通治理为例，城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹，对这些数据进行实时分析，并基于此进行多种智能交通优化。

根据阿里巴巴集团公布2017财年（2016年4月1日-2017年3月31日）全年财报，阿里云在该财年营收规模达到66.63亿元人民币，同比上年增长121%，连续两年实现三位数增长。财报显示，在2017财年第四季度，阿里云共发布152款新产品和功能，其中包括多项智能解决方案。

在通向智能之路上，阿里云一方面不断技术突破、推出更多的产品，一方面也源源不断把新技术和产品转换成为能产生营收的商业模式。正因为有本“生意经”，才能让阿里云坚持走在通往智能之路上。（本文首发钛媒体）

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App