沈向洋:微软培养了中国几乎所有IT公司的CTO,5000人撑起AI四大方向
2017年05月10日, 微软 全球执行副总裁、微软 人工智能 及微软研究事业部负责人沈向洋博士(Harry Shum)在微软全球开发者大会(Build)发表主旨演讲后,接受了包括新智元在内的几家受邀媒体的采访。
采访中,沈向洋博士认为Cortana代表了AI的未来,他多次提到Conversational AI,也即对话式AI。在他看来, 智能语音 市场远远没有饱和,各大巨头都在做智能语音助理,正表明这是一个正确的方向,而在亚马逊Alexa/Echo,谷歌Google Home等先入产品面前,微软的机会仍然有很多。微软将利用小娜、小冰的优势,从语音方面发力。
所不同的是,沈向洋提到,他认为“AI对人类情感的理解将会是非常了不起的一件事”,“大多数的人还没有认识到能够不断聊下去这件事情的重要性”。而在这一点上,微软的小冰遥遥领先于其他智能语音助理,平均多轮对话次数是目前业界最高的23次。不过,沈向洋也表示,微软的Conversational AI会“两条腿走路”,既要发挥Cortana的商务助理优势,也要充分挖掘小冰在情感聊天方面的优势。
当被新智元问及去年微软组建的5000人规模AI团队的具体组织架构时,沈向洋并没有直接回答。但他表示,搜索引擎、以Cortana为代表的智能语音助理、用AI帮助微软现有产品转型,以及用AI开发全新的产品线,是当前微软AI团队主要发力的4个方向。尤其是最后一点,沈向洋坚信,AI将颠覆所有的商业应用,那么在这其中,决定去做什么、不去做什么,是微软AI当前最重要的事情。
至于关注度很高的微软AI人才流失,沈向洋似乎对此并不是太担心,他告诉新智元 :“我觉得人才流动非常正常,一个大公司培养了很多的人才,最重要的是一个公司你要知道你存在的价值和理念,这体现在优秀的员工为什么会选择留在你这里,不光是你到外面挖人,你给在这里员工提供什么样非常了不起的环境,让他在这里面有非常好的发展。”对于其他公司来微软“挖角”,沈向洋反而感到非常自豪,认为体现了微软为中国AI乃至整个IT行业培养了优秀的人才。
沈向洋还表示,在去年微软重组构建5000人规模AI团队后,他就成立了一个“微软人工智能学院”,培养相当一批微软内部人才,“我们希望通过这样的方式,可以吸引更多外面的人才来微软。这么做,并不是我们担心又有人挖我们AI的人才,更重要的是,要把我们的人才培养成‘AI capable’。”
接下来,在回答其他媒体记者提问时,沈向洋表示,未来10年左右,计算机视觉可以识别一切。他认为未来3到5年,垂直领域AI将有所发展,看好toB的业务,而未来5到10年,他认为“可解释的AI”是一个非常值得研究的方向,这方面肯定会有重要突破。此外,沈向洋还表示,认知计算将成为Azure的“重中之重”,看来在智能云(Intelligent Cloud)方面,谷歌与微软也势必有精彩的角逐。
采访中,沈向洋提到他非常享受做研究的过程,可惜他“后来被鲍尔默赶出来去做产品”。 此外,沈向洋认为“可以从安卓兴起的过程当中学习很多东西,深度学习下一波浪潮当中怎么样可以做的更好,我不觉得微软一家公司可以把这些东西都做出来。”
新智元: 有一个问题,微软怎么应对人才流失?说实话,像腾讯已经把研究院开到西雅图了。
沈向洋博士:上次我跟马化腾讲,我说你太不像话了,把研究院开到我们门口了。小马哥还有点不好意思,还有点腼腆。我觉得人才流动非常正常,一个大公司培养了很多的人才,最重要的还是说任何一个公司你要知道你存在的价值和理念,这体现到优秀的员工为什么会选择留在你这里,不光是你到外面挖人,你给在这里的员工提供什么样非常了不起的环境,让他在这里面有非常好的发展。你去问问腾讯,腾讯的人才也在不断流失,腾讯以前没有AI的人才,所以他必须就要去挖人,去百度挖也好,去别的地方挖也好,都很正常。大家到西雅图开研究院,对西雅图本地经济太好了。在中国还出去招商,把人拉过来,像微软、亚马逊或者到其他的大公司,我们也有责任把西雅图本地经济带动起来。
新智元:就像您刚才说的一样,如何要留住AI人才,就是这个公司的实力了。不过,从现在的新闻来看,从微软研究院出去的人很多。
沈向洋博士:对,我上次在乌镇,跟刘云山书记报告的时候,跟大家说微软公司在中国,为中国IT产业培养了无数的优秀人才,我说你不仅要看到中国几乎所有IT公司的CTO都是我培养的,从联想到海尔到小公司,我说你更加要看到微软研究院在过去18年,培养了5000个学生,那些才是真正了不起的,新一代的创业公司出来——现在可能不会是这样的情况——当时计算机视觉、AI公司刚起来的时候,那些投资人来问我一些情况,我说你不要跟我讲,在中国开计算机视觉的公司,要么是我的学生开的,要么是我的学生的学生开的,这都非常光荣的事情。回过头来看,微软研究院、微软公司对中国的IT发展,很多方面都起了巨大的正面作用,特别是为中国培养了非常多的一流人才。
新智元:那您现在也觉得微软继续对外输出人才也是很自豪的?
沈向洋博士:我们一直觉得非常自豪,微软研究院一直觉得非常自豪。我们培养了李开复,我们培养了张亚勤,我们培养了赵峰、我们培养了芮勇,芮勇还是我学弟,这些都非常好,我们都觉得非常光荣。
新智元:接下来继续有高级的研究员离职的话,你们仍然觉得很光荣?
沈向洋博士:你具体应该去问问那些离开的人,他们是不是还是研究员,你听懂我的意思啊?你问问他们最近研究了什么,叫他写个算法给你看一看。
我再补充一下,微软最近在做一件非常重要的事情,就是人才方面的。6个月前我率领的AI这个部门组建后不久,我就成立了一个“微软人工智能学院”,培养相当一批微软内部人才,我们希望通过这样的方式,可以吸引更多外面的人才来微软。这么做,并不是我们担心又有人挖我们AI的人才,更重要的是,要把我们的人才培养成“AI capable”,所以我们就有一字头的课、二字头的课、三字头的课,一直到六字头的课,类似研究生这样的课。我最近刚刚做完一期AI 611这门课,专门做hands-on project,深度学习具体项目。有10个项目,非常了不起,他们这门课结束的时候,我专门用了2小时去听了他们的报告,非常好!所以,我们现在就是在不断培养AI的人才,既包括内部的人才培养,也包括吸引外面的人才参加。
在LinkedIn发布的全球和中国科技企业最佳雇主的排名上,微软在全球排名第二,仅次于谷歌。但是在中国,微软超越了谷歌,成为最佳雇主。详细情况参见新智元公众号的二条报道:《LinkedIn 技术VP王迪专访 | 全球AI人才聚集,Top10中美公司排行榜》。
新智元:微软去年做了重组,您率领一个5000人规模的AI团队,但是对具体的组织架构,我们一直都没有太多的了解,希望您能在这方面介绍一下,这5000人的团队具体的侧重点、方向、人事架构是怎么样的。我相信5000人还是分布在世界各地吧,这时候你们采取怎样的联系方式?
沈向洋博士:我们通常都不会对外部讲具体的架构和人事,内部当然任何一个单位都有一个组织架构。不过,我可以简单跟你讲一下,微软发展AI主要还是在4个方面。
第一,搜索引擎方面。 你可以同意,也可以不同意我的意见,那就是今天世界上最大的人工智能可能还是搜索引擎,微软Bing这么多年下来做了知识图谱,超过25亿的实体(entities)。这里面就有很多的知识,搜索引擎本身不仅仅是一个业务——当然现在Bing也很赚钱,我们在美国占22.6%的搜索市场份额,再加上雅虎的11%(后台技术是微软做的),所以我们在美国有1/3的搜索份额,在英国最近涨到16.5%。从AI的角度来讲,搜索引擎主要就是World Knowledge——对世界知识的积累。
第二,非常非常重要的一件事情就是Cortana,这是一个私人的智能数字助理,我觉得Cortana代表了AI的未来,对人的了解。 要做好AI需要三个方面的知识,一个是你对世界的理解,一个是你对工作的了解,一个是你对用户的了解,这三件事情在一起的话,才可以做得非常好。我觉得小娜在朝着这个方向走,要去做这个事情当然要有很大的投入在里面。
第三,其他的公司和微软一起合作,怎么样令AI帮助微软(所有产品的)转型。 我刚才提到Office,也提到Cloud,也提到Windows,我们一起做。同时,我们把这样的一些技术拿出来给其他所有Microsoft开发者去做,比如认知服务(Cognitive Service),这也是我在演讲的重点。认知服务这么多年一直都是我们AI部门在做,其中有很多的技术是从微软研究院做出来的。
第四,也是我自己觉得非常激动的一点,我在主旨演讲的最后稍微提了一下,没有机会展开讲,那就是Every Business App is going to be Disrupted by AI——“所有的商业应用都会被AI颠覆”。 所以,我们微软正在这里面选择哪些方向,哪些商业的AI机会我们会去挖掘,希望能够在不久的将来有机会跟大家再分享这边的进展。
新智元:目前这些方向还是在探讨阶段中吗?
沈向洋博士:我们已经做了很多的产品原型,甚至很多的产品和服务已经有很多人在用了。我在我的演讲中也提到,从销售到市场到售后,这些我们都有在做。
新智元:现在有很多公司都将Conversation AI作为一个入口,但也有人认为对话是一个伪需求。从刚才您的介绍当中,我是否可以这样理解,微软跟其他公司所不同的,是微软的对话平台是从情感这个角度去切入?
沈向洋博士:微软不仅从帮助你完成任务的角度,微软同时也非常关注情感方面的研发,我觉得我们是两条路同时在走,我们小娜是帮助你,你有什么事情,我帮助你找到需要的问题,同时我们小冰更加是从情感的角度,陪你聊天,试图理解你,跟你不断对话。这里面大家的设计理念是非常的不一样,比如你要帮人完成任务,你希望越快越好,你要陪人聊天的话,你要能够聊越久越好,这两件事情从产品和设计上是非常不一样的。
大多数的人还没有认识到能够不断聊下去这件事情的重要性,我给你讲一个数字,大家都不见得知道。一个人一天讲几句话?事实上,人一天可以讲6000句以上,你可能都没有认识到这一点。为什么人要不断讲话,这绝对不会是因为要完成一件事情,它是人类自身学习的过程,通过对话、通过交流,跟不同的人学到不一样的东西,这一点是微软做AI,特别是对话式的AI,非常注重的一点,其他的公司不见得都很注重。
以下是专访现场沈向洋博士回答其他记者提问的实录。
问:微软全力投入AI,您的部门会继续扩编吗?
沈向洋博士:你这个问题要问我们CEO(笑),我觉得一定会的。
问:接下来的首要任务是什么,有没有一个发展的进程,比如短期和长期的规划?
沈向洋博士:是有的。任何一个企业,一个单位,特别是大了以后,一定要去想短期的目标是什么,中期的希望是什么,长期的愿景是什么,一定要从这个角度去想。我的部门比较特别的地方就是,我除了AI以外,还管研究院。在研究院我们有1000多位科学家,刚才新智元的同事也问道,我觉得最重要的就是,要不断培养一代一代新的了不起的研究员,去做更了不起的技术。
例如我刚才提到,人工智能(更多在离散的空间做符号处理)和脑科学(更多在Neural神经元做连续处理)这两个空间的融合。符号可解释的空间和连续的脑空间之间的关系,三五年前基本上没有什么人研究这些方向。我认为更重要的就是应该培养新一代,看到这样的问题。如深度学习,要去解释它。
回到您刚才问的,微软有些什么样的目标?我觉得看得蛮清楚的,短期的话AI还是要看到短期业务,哪里有真正的商业价值。就是我们可以挣一些钱,定个小目标,这都非常重要。但是,更重要的事情是AI这个部门成立之后,我们要想清楚如果我们真的觉得AI会颠覆更多的行业应用,在颠覆的过程当中,我们的机会在哪。
主要是两个方面: 一个是在现有的产品,比如Office等跟AI结合,将会有哪些颠覆性的内容产生,有什么新的产品出来,有什么新的功能出来,这边的话我们进展得非常好;另外一个你要去想,新的产品线在哪里,你有没有一条新的产品线出来,三五年以后可以做到十亿美元的生意。要思考,你有没有这样的业务,五到十年可以做到一百亿美元的生意。如果有,当然要放马去追求这样的机会。所以我们现在整个AI部门最重要的事情,就是决定要做什么,决定不做什么。
问:Harry你好,您之前提到的人工智能研究方向大致可以分为感知和认知两方面。我想请您以更加技术的语言来说明一下两者的趋势,可以举个例子讲一讲。
沈向洋博士:说到人工智能,大家今天激动得不得了,我自己也觉得有些东西是真的已经在发生了。首先,你要回过头来看,为什么会有“人工智能”这个词,“人工智能”实际上是对应于“人类智能”提出来的,就是human intelligence。
为什么觉得人有智能,人的智能基本上分成两部分,一部分是感知,另一部分是认知。 感知是里面最了不起的,而其中最大的一部分就是视觉的感知。以前有人做过这样的研究,一个人大概91%的信息是从视觉收集过来的,我忘记了他用什么样的方法算出来这个数字,但是我想大家基本上会同意,人绝大多数感知都来自于视觉。然后是听觉,然后才是其他的感知,比如触觉。
我觉得这边的进展非常大,过去这一年我都在讲,计算机语音识别的突破最多是5年的事情,也就是说5年之内计算机语音,不管你怎么去讲它都能识别,而且肯定会比人类强。然后,接下来10年左右的时间,计算机视觉也会达到这一点,今天视觉很多东西已经超过人,具体来讲比如人脸识别。但我讲的是一个很general的,anything is recognizable,到一个新地方,AI看到一个新东西能够联想到其他东西,这些我认为大概十年左右的时间可以实现。
但是在认知方面,今天我们远远没有获得突破,都谈不上跟人类相比的地步。首先是自然语言处理的问题,然后就是知识获取的问题。越来越多的人更应该去做这方面的工作。自然语言处理,我刚才也提到机器阅读,语言这个问题,相对来讲的确是比较复杂。用今天现有的方法,包括深度学习的方法,解出来的效果还不是足够好,当然用深度学习已经可以帮助到我们很多东西,比如像翻译也用了很多自然语言的东西。
更重要的,今天大家对整个“认知”这样的一件事情的定义,还在一个比较初级的阶段,什么叫做常识(Common Sense)? 你怎么知道见到这个人以后,为什么会对他很有一种亲近的感觉?这些我们还不是很理解,而这是一个很大的问题。稍微岔开一点讲,很重要的问题,今天我们个人工智能做的这些东西,和脑科学的结合不够,理解也不够。很主要的原因就是对“智能”的很多东西,只有人脑这样一个范本,但人脑结构很特别,今天我们还不够理解。脑科学作为一门科学,今天也还处在一个早期的阶段,我们还不能做太多的实验,也不能随时把一个人的脑袋打开塞一些东西进去。
这个是一个长期的问题,现在越来越多的人也在想这样的问题。连接人工智能和脑科学,今天有一个方向我们觉得是很激动人心,现在在微软研究院很多的人在做这方面的事情,我也跟很多大学有一些合作,就是所谓的“可解释的AI”(Explainable AI)。我认为,Explainable AI在接下来5到10年,肯定可以做出非常了不起的成果。今天我如果有研究生的话,我就会让他们做这个方向的工作,原因非常简单,因为今天AI最大的突破就是深度学习,但是深度学习的一个最大的问题就是,出来的结果非常好,但是你没法解释。
我自己看到的,这方面写得最好的一篇文章,是最近在《纽约客》的一篇有关医疗AI的。 为什么看同一张图,医生会跟你讲,你没问题,原因是一、二、三。但今天AI还做不到这点,深度学习做不到这点,很大的问题是大家解问题的空间不一样,医生是在一个所谓的neural,脑的这样一个连续的空间在解,而AI很多的理解是在符号的离散的空间上去做。
所以,如何把这些东西连起来,从技术上有讲有很多有待突破的地方,也是我们现在研究院很认真在做科研的一个方面。
问:微软现有的一些成果或者说优势都有哪方面?
沈向洋博士:我刚才提到在一些感知方面,从计算机视觉到计算机语音,我自己是觉得我们都是领先的。
问:有没有这方面的数据,或者特别强有力的案例?
沈向洋博士:我们是第一个做到语音识别达到人类水准,特别是在最难的数据级switch bot data set,在我演讲里面提到,6个月之前我们已经做到这一点。在计算机视觉方面,我们两年前第一次做到物体识别(Object Recognition)跟人一样的准确率。接下来,我希望我们在自然语言理解方面也能有所突破。翻译也是这样,翻译的质量特别是Spoken Language(口语语言),我们肯定也是世界领先的水平。但是有那么多的语言要去做,还有很多工程方面的问题要去解决,今天微软也只提供60种语言而已,世界上有6500多种语言,怎么样把人工智能普及化,也是我们要考虑的。
问:怎么样把研究院里研究实际去产品化和商业化。您在成立这个团队的时候,从研究到产品的流程有什么变化吗? 另外一个是开发新的产品,比如大会第一天上的Demo,帮助患帕金森症的设计人员重新执行作画,怎么样把这样的研究个案去扩展开来?
沈向洋博士:这是一个非常好的问题,不知道在座有多少人做过研究,科研是很不一样的东西,很多人不明白,说这么多人做科研,怎么还没有产品化。科研就是一个很长期的东西,你要么就不要说自己做科研,要做科研就要有耐心。比如今天大家谈的热火朝天的量子计算,具体哪天量子计算机可以做出来,没有人知道。有人知道还得了,VC会像狼一样扑出去了(笑)。在这一点上,美国的这套系统还是值得我们学习。从大学开始,到研究所,再到工业界。以前的AT&T和IBM,再到现在的微软,很多公司愿意花很多的钱出来做长期的科研,而绝大多数的科研成果不仅仅属于本公司,只是自己的公司有可能得到利益。这一点我们盖茨讲得非常清楚,比如苹果和微软早期的成功,很重要的就是图形用户界面,而graphic interface最早是施乐做出来的,我们跟他们学习。同样,今天微软做了很多了不起的事,但是可能其他一些公司,甚至一些初创公司还会做得更好,这都是很正常的。
而且,做科研是非常愉快的一件事情,做科研最愉快的事情就是根本不用担心别人在想什么,你自己拍拍脑袋想想就可以,要有一个了不起的想法——我以前是多么的享受做科研,后来被鲍尔默赶出来去做产品。
最近我跟微软亚洲研究院同事交流,其实我们能够提供最了不起的东西是一个环境,这个环境里面不光是大家的待遇还不错,更重要的是边上有比自己更聪明的人,你可以向他们学习。第二,在微软研究院我们提供一个自由的空间,从来没有要求你一定要做什么,研究员你自己想做什么,你觉得应该做什么,就去做什么。因为你已经是最聪明的人之一了,才进得了微软研究院。有几个人选择要走了,出去做VC啊,换一家公司啊,这都很正常,我们就不断再培养下一代的人,重要的就是你要有一个能够不断培养人才的环境。
当然,因为你不是一个公益的研究院,当然对公司是有责任的,包括最重要的一件事情,就是从技术到产品的转化。目前,AI本身今天很多的东西还在研究阶段,所以今天微软重组,把AI和研究院放在同一个部门——我觉得非常荣幸能够领导这样的部门——我们看到了非常多的机会。怎么从技术到产品转化这个问题,可能今天最好的例子就是认知服务,其中大概2/3的技术是原来微软研究院做的,而且做了很多年,以前我们不是很清楚,一些计算机视觉的技术怎么转化成产品。但是因为有Azure,有认知服务这样的机会,很多很多的微软研究院的技术,都已经通过认知服务转化成为产品。
我再给你举两个例子,今年7月份在夏威夷,我会去计算机视觉最大的国际会议CVPR,今年他们请我做主题演讲,我演讲的题目就是“Commercialize Computer Vision – Success Stories and Lessons Learned”。 这里面我会举三个例子,一个是认知服务,另外一个例子是我们最近推出了一款很了不起的相机iOS App,叫Microsoft Pix,大家有机会可以试一试。第一版出来的时候,里面就有12篇以前的论文做基础。当然有很多其他的公司相机应用做的非常好,包括iPhone本身的camera做的也相当好。
第三个例子是我最喜欢的HoloLens,它研发的过程是“研和发,研和发”不断循环的过程。 HoloLens这帮人之前就是做Kinect,Kinect做出来微软研究院就做了Kinect Fusion,又做了一个项目叫Holodesk,如果是三维的东西,你怎么样加一些三维的虚拟物体进去。后来微软有一批非常了不起的做产品和设计的工程师,他们想到要在此基础上做成HoloLens,在这个过程当中,里面很多计算机视觉、语音的技术都是微软研究院一起做的,是一个共同研发的过程。
到最后你还是要有产品,因为对普罗大众来讲,他不会去看论文,也不知道你的论文有多了不起。你要跟人解释,最容易解释的方法就是你给人看看你的产品,HoloLens马上就会被人看到,我们希望有机会做一些更了不起的产品,不光是对消费者,更多是针对企业用户的产品。我个人认为,三五年内,对AI而言最大的机会还是在企业市场中。
问:您刚才把微软的Cortana还有Google、亚马逊的相关产品对比,讲到各家service都是很不同的,您能不能给我讲个例子展开一下。此外,国内AI公司有一个观点,认为如果做纯2B的开发者的生意,如果提供工具,本身可能不是一个在国内环境下很好的商业模式,觉得很苦不赚钱。但您对Cortana 的定义就是一款2B的工具。我比较好奇您怎么看?
沈向洋博士:第一个问题比较简单,我想强调一下,其他公司在做digital assistance都做得很好,但都非常难做。最近有个人在网上做了一些调查,好像75%的时候,如果你问Alexa问题,她会说“我没有答案”(I don’t have an answer)。实际上,今天语音这个东西,不会是因为有一家已经做了怎么样,其他人就不用做了,[市场还]远远没有[饱和]到这个地步,谷歌也在做,亚马逊也在做,苹果也在做,微软也在做,国内很多公司也在做,非常好,这个方向至少大家都看得很清楚。就像 无人驾驶 车一样,大家都在做无人驾驶车,已经没有人讨论这件事会不会发生。
在这样一个设计的过程当中,因为它本身就叫digital assistant,帮助你把事情做好。 大家想的都是怎么样尽快找到你需要的东西,尽快帮你完成这样的工作,在这样的设计过程当中,完成任务的时间越短越好。另外一条思路,很特别的地方,我觉得还没有太多的人做的是从聊天 机器人 :我是你的同伴,我是陪伴你的,我不帮你解决任何问题。从微软研究院来说,我们是在两条腿走路,这肯定是我们最不一样的地方。
刚才新智元的记者也问到,微软是不是只做情感方面?不是这样的,我们是两条腿走路。这里面就像我刚才讲的有world knowledge、work knowledge、user knowledge,能够帮助你解决问题。另外一个怎么样可以得到你的信任,怎么样可以跟你继续做朋友,怎么样跟你继续聊下去,在这个过程当中不断积累知识。我们用的产品设计metrics,你能够和你这个Agent可以聊多少个来回。Cortana也好、Siri也好,Google Now大概就是三个来回,相当于对话一个半来回。你问Siri,西雅图的天气怎么样?它说,还是下雨,你就没什么问题问了。但小冰就不一样,小冰我们今天的最高对话次数是23个来回,你不断有这样的机会可以和它交流,在交流当中再去学习。我想强调的,并不是我们只做一个不做另外一个,就是助理(服务)和情感(陪伴)我们两边都要做。
第二就是你讲的2B的问题,我也听很多人讲,对于一个提供商用AI服务的初创公司来讲,面对像微软这样能稿提供很好的AI服务的公司,小公司有没有这样的一些商业的机会继续活下去?这个问题我自己是这么看:今天提供这样所谓的API,我也觉得一般小公司可能比较难做,因为有很大的投入,收费的方式各方面还要跟很多大公司竞争。
我认为很重要的一件事,接下来商业的机会还是在于所谓的business AI。因为它每一个vertical都必须要用AI,要去做这样的东西,你得一定要真的深入到某一个垂直行业中,必须要有很特别的data,你必须要有这样的用户,能够用到AI的应用部署出去,这样你可以做反馈。大多数的AI今天的技术不可能做到100%,甚至都不可能做到90%,它里面有很多的错误。比如Alexa、Siri、Cortana,今天来讲,很多时候它都没有真正回答你的问题。但是你需要有足够多的用户,他愿意继续用你这样的AI应用,给你提供反馈,给你提供数据。我自己是很看好垂直行业的。
问:您刚才的演讲里面主要是两大块,一块是AI怎么帮助开发者更好的去开发更customize应用场景,另外一块说重新定义(redefine)。我想问一下,微软通过人工智能对产品重新定义具体怎么做,有什么样的规划?
沈向洋博士:这个问题非常好,我今天讲的主要是三个方面。 AI的三大方面,第一,你要有非常强大的运算能力;第二,你要有非常了不起的算法;第三,你一定要有自己的数据。
我用微软的例子来介绍一下,在微软,我们当然相信,微软所有的产品都必须要AI化,重新去定义这样的产品。我们现在很注重的地方是两个方面,一个是在所有的Office产品,在主旨演讲中我给大家看了 PowerPoint一个功能,就是翻译(translate)。其实PowerPoint他们还做了另外一个,我自己非常喜欢的,所谓的图说生成(image caption):来一张照片,PowerPoint图说生成可以自动给你出图片说明,这个我们已经做得相当好了。
PowerPoint很多人用。这样的数据可以帮助我们不断改善一些算法。前不久我们也发布Word,Word里面使用AI技术,这也非常非常重要。
这里面还有很多AI的技术都才刚刚开始,我自己觉得Office最激动人心的技术就是所谓的机器阅读。前不久微软买了一个加拿大的初创公司叫做Maluuba ,主要就是做这方面的工作,用自然语言、深度学习的方法来做这个东西。深度学习里面一个很重要的问题,就是回答问题。我觉得对Office的影响会非常巨大,所以我们AI部门的同事和Office的同事一起在做。
另外一个就是在云这里,大家合作非常多,你到Azure.com主页的产品里面,Cognitive Services的内容放置最显著的位置上,这是Scott和我,跟我们产品团队的同事review了以后决定,Cognitive Services会变成Azure的重中之重。Windows还有很多AI,像HoloLens还有很多AI的技术,计算机视觉、计算机语音方面。
问:您刚才讲到微软在vertical领域跟一些服务商、应用商之间的合作,在平台方面,像谷歌、亚马逊、百度这方面的合作,怎样去解决社会责任和公司商业利益方面?另外,陆博士去了百度之后,百度和微软在中国人工智能的会有什么合作吗?
沈向洋博士:你这几个问题都问的非常好,微软比较特别,我们有一个微软研究院,研究院本身是非常开放的,所有科研的东西每年我们都发很多论文,几乎所有的公司都没法跟我们比,到今天为止,过去这20多年下来,在所有的计算机领域最一流的位置上,最佳论文奖获得者,微软研究院遥遥领先全球第一。我们今天微软对社会仍然有这样的责任,继续做最了不起的计算机科研,包括AI这方面,并且以开放的方法去做。
从一个商业公司的角度来讲,我们还是有两个方面,你看的很准确,第一我们提供一个平台和工具,大家都可以用的,包括科研人员、大学的老师、学生都可以用。我们公司也做垂直行业,office AI会越做越好,比如讲云里面的应用,比如database,这些东西我们都可以继续做。你作为一个商业的话,跟其他产品竞争很正常。这些大的公司之间,大家可以怎么合作,可能有几个不同的层面。
在工具层面,我举个例子,比如讲TensorsFlow,有一些新的工具出来,像深度学习做到这样的地步,大家都觉得有道理,它就自然会出现一些工具出来。在TensorFlow出现的同时,至少有4、5个工具,比如讲亚马逊最近收了公司去做MXNet,大家各有所长。TensorFlow谷歌推的比较早,推的比较猛,用户很多。很重要的一点,我们作为一个community,大家应该把一些力量聚集起来。
我觉得大家可以从安卓兴起的过程当中学习很多东西,在深度学习下一波浪潮当中怎样才可以做得更好,我不觉得微软一家公司可以把这些东西都做出来。
国内公司你提到,我们就是跟国内的公司非常开放的,你刚才提到陆博士,我刚才提到很多其他的同事去其他的公司,大家的关系都非常好。大家可能知道去年11月的时候,我回去微软亚洲研究院成立了一个院友会,亚勤、我、洪小文,我们一起组织其他人一起过来,大家这么多年是很好的朋友,即使大家不在同一个公司一起工作的话,我觉得最重要的是大家还在一个行业,大家应该互相帮助,我当然是希望每一个同事在微软都做的很好,希望以前的同事可以继续做的很好。
问:微软会不会越来越多的考虑Open Source的工具?
沈向洋博士:肯定,微软其实现在已经非常开源了,你看我们CNTK现在完全是开源的。开源是一种文化,有不同的方法可以做开源。我自己是觉得开源对这个世界的科技发展产生了巨大的深远影响。微软发展很迅速,我们完全是拥抱开源。