微软AI秀肌肉:Windows之后,用Azure收割市场
图: 微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋
本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!
在 Build 2018 大会召开 12 天后,微软将其 AI 新战略从西雅图搬到了北京。
这是微软首次在北京举办的大规模人工智能大会。微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋携微软技术院士黄学东、微软最新成立的云计算与人工智能事业部全球高级副总裁郭昱廷、微软 ( 亚洲 ) 互联网工程院副院长李笛上台,全面展示了微软在人工智能领域的技术、资源以及合作部署。
此次大会,微软推出多款新品方案以及合作计划,彰显出微软全面押注 AI ,争夺云计算与边缘计算市场的决心。
下面,智能菌为大家梳理了微软在中国 AI 市场的布局策略:
Azure :微软 AI 新时代的 宏愿
与微软不久前举办的 Build 大会相同,微软此次在中国召开的人工智能大会也将重点放在了基于 Azure 的智能云与边缘计算上。
微软之前宣布了 Azure IoT Edge 开源,据悉, Azure IoT Edge 能够在 Linux 和 Windows 上运行,能够允许开发者进行扩展、添加功能,并部署到任何环境中。
数据显示,到 2020 年全球智能边缘设备的总数将超过 200 亿台,微软对 Azure IoT Edge 物联网服务寄予厚望。
会上,微软还发布了最新的 Azure Sphere 预览,这是一款为联网微控制器( MCU )提供工业级安全保障的完整平台级解决方案。 Azure Sphere 方案将提供经过特殊设计的安全芯片、安全操作系统和云端安全。
目前,每年全球有 90 亿片微控制器被安装到从家用电器到工厂设备的各种机器中,但只有 1% 具有联网功能, Azure Sphere 力图打开这一市场。
微软基于 Azure 云的认知服务于两年前推出,主要是以 API 的形式为开发者提供 AI 能力,覆盖语音、视觉、语言、机器翻译、 OCR 识别等 24 项服务。目前,微软已经有超过 100 万开发者使用认知服务。其中,据黄学东介绍,微软的语音和翻译新产品包括统一语音解决方案、量身定制功能、麦克风阵列开发系统。
微软还介绍了微软智能云上的一项托管服务 Azure Batch AI ,这项服务允许数据科学家和人工智能开发者以非常简单的方式利用包括 GPU 在内的 Azure 云计算资源对人工智能模型进行训练。
在对话式交互领域,微软重点介绍了 Azure Bot Services 对话机器人服务,目前已经累计有 30 万开发者采用该服务开发。对话机器人服务能够根据业务需求进行定制,还支持发布到微软小娜( Cortana )上。
图: 云计算与人工智能事业部全球高级副总裁郭昱廷
不管是针对物联网的 Azure IoT Edge ,还是 MCU 解决方案 Azure Sphere ,托管服务 Azure Batch AI ,对话机器人服务 Azure Bot Services ,还是微软认知服务,微软都在加速基于 Azure 的全面 AI 部署方案。据沈向洋透露, Azure 智能云已覆盖全球 50 多个区域,并获得超过 70 项安全合规认证”。“ Azure 汇聚了微软在人工智能领域的全部投入与技术积累,是开发、部署、运行人工智能的最佳云平台,同时也是将智能云与智能边缘融会贯通的关键环节。”由此可见,新战略下微软对于 Azure 的重视程度早已超过了 Windows 。
从平台级开发商切入,大规模收割市场
在微软 Build 大会上,纳德拉提出了微软未来的新定位,即致力于成就“智能云与智能边缘”时代的数字化转型。
要想实现这一目标,有 Azure 和一系列的技术平台基础后,还需要大规模的应用。
这一次,微软放下身段,大量吸引平台级开发商深度合作。
在 Build 大会上,微软也已经与亚马逊合作,将微软小娜结合到 Alexa 智能音箱中,让用户通过 Alexa 调用小娜及其背后的人工智能服务。
微软还宣布与高通合作打造运行 Azure IoT Edge 的视觉人工智能开发工具包,开发者可以利用 Azure 机器学习服务及高通视觉智能平台与高通人工智能引擎的硬件加速开发应用解决方案,摄像头也可以用于更高级的 Azure 服务,例如机器学习、流分析和认知服务,并且可以从云端下载到边缘环境中在本地运行。
而在此次会议上,微软再次展示了其与无人机制造商大疆创新( DJI )达成的深度合作,后者将利用微软 Azure IoT Edge 服务开发适用于农业、建筑行业、公共安全及更多应用场景的解决方案。
微软还与合作伙伴小米生态链企业香蕉合作展示了基于微软认知服务开发的魔芋 AI 翻译机,能够提供 14 种语言的实时语音翻译。中国移动也正在与微软在语音识别、机器翻译技术应用方面展开深入合作。
图: 微软技术院士黄学东
会上,微软合作伙伴才云科技展示了利用 Azure Batch AI 服务为唯品会开发了容器化的人工智能解决方案,将其海外业务团队的效率提升了 85% ,对 100 万张图片进行分析标签化处理的时间缩短到之前的 1% ,让 AI 系统迭代的速度获得了极大的提升。
微软还推出 “ 3 个 100 ”计划,将筛选 Azure 机器学习、 Visual Studio Tools for AI 等 100 项微软人工智能服务与开发工具,携手来自 100 家具有影响力的企业的开发者和数据科学家,共同创造出 100 个针对关键行业的人工智能解决方案和落地场景。
在这个计划中,微软将持续不断地提供产品与技术支持,和这些有影响力的公司以及他们的开发者和数据科学家开展形式不同的架构研讨和极客编程,以制造业、零售业、金融服务业为主要切入点,结合客户实际应用特点,从生产、制造、售卖、体验、营销、售后、服务、反馈等全阶段全过程落地实际应用场景,助力企业数字化转型。
沈向洋表示,中国开发者是微软生态系统中关键的组成部分。目前微软在中国拥有 40 多万开发者,其中超过 10 万人在使用微软人工智能进行开发。
微软 AI 的另一级:小冰在中国市场加速落地,将开放全双工语音技术
微软小冰是面向情商( EQ )维度发展的人工智能系统,已在五个国家落地。目前,微软小冰也在加速落地。
图: 微软 ( 亚洲 ) 互联网工程院副院长李笛
今天的大会上,微软小冰团队宣布了一项人工智能内容创造的全新技能,针对儿童市场推出定制化有声童话故事,将于儿童节正式上线。在这项定制故事的技能中,家长可以设置童话故事的主人公和故事倾向,如更偏教育意义等,然后安排微软小冰完成创作。微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐。
据微软小冰团队相关人员介绍,小冰在短短 20 秒内即可完成一集约 10 分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准,而且该项服务目前完全免费。
微软小冰为助盲公益机构红丹丹提供中国最大的公版儿童有声读物全集 “小冰姐姐讲故事”,囊括上千小时的童话故事、科普百科、名人轶事等有声读物。红丹丹服务的 104 所盲校的学生和少年儿童都可以通过心目图书馆找到这些内容。
李笛介绍,截止目前微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等。在有声读物领域,微软已拥有接近 4 万集有声童话内容。 6 个月来,这些有声读物已顺利投放到占中国市场 90% 的儿童早教机、故事机和在线播客平台,播放总时长超过 400 万小时。
此外,李笛还在会上宣布,微软将很快向合作伙伴和开发者开放 “全双工语音技术( Full Duplex )”,开发者可以使用这项技术打造自己的对话应用。一年多以前,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过 60 万通电话交流。今年 4 月,微软正式在美国和中国同步宣布了 Full Duplex 感官,并已完成产品化落地。小米生态链企业亿联客开发的 Yeelight 语音助手成为全球首个搭载全双工语音交互感官的智能设备。
联合中国多所大学布局 AI 教育,推在线 AI 学院
会上,微软亚洲研究院宣布讲联手北京大学、中国科学技术大学、西安交通大学、浙江大学共同发起共建 “新一代人工智能开放科研教育平台”。这一平台将聚焦于中国人工智能领域的科研、教学和生态建设。
另外,为了推动全民 AI ,微软还推出在线人工智能学院( https://school.azure.cn/ ),目标是一年内培养出 10 万余名人工智能人才,将免费提供包括 AI 基础、核心技术和高阶应用在内的总共 250 课时的 12 门人工智能学分课程,覆盖 10 项应用技能。完成课程学习的用户,还可申请微软专业学位课程( MPP )作为职业技能认证。
在支持诸如 TensorFlow 、 CNTK 等业界主流的深度学习平台的同时,微软还发起了开放神经网络交换( ONNX )项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。目前,已经有 15 家公司支持 ONNX ,并且还有更多公司正在加入进来。现在已经有 PyTorch 等六种顶级框架支持 ONNX ,其它框架则可以通过转换器获得支持。
在 Build 2018 微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架 ML.NET 开放预览。 ML.NET 让任何 .NET 开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去――开发者完全无需具备开发和调试机器学习模型的经验。
微软 Project Brainwave 能利用 Azure 上最先进的 FPGA 基础架构完成实时的人工智能处理。用户只需通过实时的单一批数据,就能得到以往需要多得多的批数据处理才能得到的性能,实现人工智能的实时计算。而且, FPGA 运算不仅仅只在云端提,也可以通过 Azure Stack 混合云在本地提供 FPGA 。
沈向洋宣布,微软将充分发挥其在人工智能领域的全部优势技术和资源,与中国产、学、研各界展开全方位合作,为科研教育打造一流平台、为企业创新开发先进方案、为全民 AI 提供免费培训;与此同时,微软将认知服务扩展到智能边缘,推出 ONNX 项目及 ML.NET 开源跨平台人工智能开发框架,以 18 项创新技术、工具、服务,全力助推中国开发者。
微软亚洲研究院: Azure 背后的 AI 实力支撑
作为美国以外规模最大、功能最全的研究机构,微软亚洲研究院近几年在计算机视觉、自然语言理解等方面取得了很多突破:
2015 年微软亚洲研究院发布的 152 层残差网络( ResNet )的图像识别准确率已经达到 96% ,胜过人类;
2017 年 8 月,微软在 Switchboard 语音识别基准测试中的错误率已经降低至 5.1% ,达到了媲美人类专业速记员的水平;
2018 年 1 月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的 SQuAD 文本理解挑战赛上获得超越人类的分数;
2018 年 3 月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集 newstest2017 的中 - 英测试集上,第一个达到了可以与人工翻译媲美的水平。
微软亚洲研究院开发的 OCR 技术,为各种人工智能应用增加图形文字识别功能,目前支持从 Office 到 Skype 、 Bing 、 HoloLens 的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。目前手写识别 OCR 引擎 V3.0 版本的精度达到了 70.5% ,已经部署于微软认知服务,可供开发者用于自己开发的智能应用。 ( 小羿 )
关注网易智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。