微软全球执行副总裁沈向洋:感知和认知是人工智能研究方向
在西雅图开幕的Build全球开发者大会上, 微软 首次没有在首日主题演讲提到Windows,将最重要的位置留给了云服务和 人工智能 。微软CEO萨提亚·纳德拉(Satya Nadella)更明确提出,微软要用人工智能重新定义微软的所有业务。
如果说人工智能是贯穿未来微软所有业务的血液,那么领导微软未来核心竞争力的重任就落在了微软全球执行副总裁、人工智能及研究事业部负责人 沈向洋 的肩上。大会首日的主题演讲,正是由沈向洋来最后进行压轴技术展示。
在主题演讲之后,沈向洋接受了包括新浪科技在内的中国媒体群访。虽然已经在台上演说了将近一个小时,但在近一个小时的采访过程中,沈向洋一直站着侃侃而谈。谈到人工智能未来发展的时候,这位美国科技巨头公司职位最高的华人脸上挂着一种自然的兴奋。
AI重新定义微软
谈到如何具体实施“人工智能重新定义微软业务”时,沈向洋表示,微软所有的产品都必须要人工智能化。举例来说,所有的Office产品都正在进行人工智能化,很多技术都还是刚刚开始。Powerpoint不仅加入了自动翻译功能,还添加了图片自动说明的功能。Word里面也使用了人工智能技术,其中最激动人心的技术就是机器阅读。
他介绍称,微软刚刚收购了一家加拿大人工智能创业公司Maluuba,后者就是用自然语言和深度学习的方法来做机器阅读功能。这方面的技术会给Office带来巨大的影响。目前微软人工智能部门和Office部门正在密切协作。
而在微软的转型重点云服务,微软在努力用人工智能的云帮助企业用户,其中包括Azure云服务中的认知服务,这会是Azure未来的重中之重。而Windows部门和Hololens也加入了很多 计算机视觉 和计算机语音方面的人工智能技术。
对话交互AI是方向
对话交互人工智能(Conversational AI)的概念是过去一年各大人工智能公司都在推崇的概念。沈向洋介绍称,计算机最早是指令界面,后来是图形交互界面,但这些还是需要人类学习计算机的语言。到了对话交互人工智能的阶段,则是计算机来学习人类的语言。
但他强调,目前对话交互人工智能的产品研发还处在早期阶段,还远远没有达到通过对话实现人机交互。微软的Cortana和苹果的Siri都还是计算机根据人类指令完成一些任务。
沈向洋表示,自己比较看好聊天 机器人 的发展方向,微软在中国推出了小冰,在日本做了Rinna,在美国推出了Zo,这些都是计算机试图理解人类情感的尝试。他提出,人工智能只有智商IQ是远远不够的,还需要拥有情商。而且目前人工智能的水平甚至还没有达到一个四五岁孩子的能力。
感知和认知是AI研究方向
沈向洋提到,人工智能这个词汇是上世纪六十年代美国计算机教授约翰·麦卡锡(John McCarthy)最先提出的。人的智能分为感知和认知两个部分。在感知方面,最大的一部分是视觉感知,然后是听觉,之后还是其他感知。
在这方面,计算机进展很大。他预计, 未来五年计算机语音识别可以达到识别人类的水平,未来十年计算机视觉也可以达到这一点。实际上,今天计算机视觉在 人脸识别 方面已经超过了人类,但到一个新地点,看到一个新东西就可以识别和理解,这大概需要十年的时间。
但谈到认知,计算机却远远没有达到和人类相比的水平。首先是自然语言处理,然后是知识获取。在自然语言处理方面,目前的深度学习方法虽然带来了一些帮助,但解出来的效果还不是足够好。
沈向洋继续阐述说,深度学习是目前最大的突破,但也存在一个问题——虽然效果非常好,但却没有办法解释。人类可以分析出为什么一二三,但深度学习和人工智能目前都做不到。
共同推进行业发展
在谈到人工智能未来发展的规范时,沈向洋介绍微软刚刚成立一个“人工智能伦理委员会”,由人工智能研究院和微软法务部门的负责人担任联席主席,微软每一个大业务和产品部门都会派代表参加委员会。
此外,去年12月,微软还联合谷歌、Facebook、亚马逊、IBM五家人工智能领域的巨头成立了人工智能合作组织(Partnership on AI),共同制定人工智能行业未来的发展规范。据沈向洋介绍,目前这个组织已经有100多家公司加入其中。
他提到,微软会提供一个平台和工具,向科研人员开放;同时也做垂直领域,包括Office AI和在云里面的应用。作为一家商业公司,微软和其他平台竞争很正常。谷歌和亚马逊都在积极推进人工智能的研究,但大家作为一个社区,应该聚集一些力量。
“这方面可以从当初Android的兴起中学习一些经验。深度学习下一波浪潮中,我们怎样可以做到更好。我也不觉得微软一家公司就可以做出这些东西。现在微软已经是非常开源了,包括完全开源的CNTK。开源对这个世界的科技发展产生了巨大的深远影响,微软会完全拥抱开源。”