人工智能“三足鼎立”,微软凭什么自居王者?
Yoshua Bengio 从来不会站队。他是主导人工智能深度学习行业的三巨头之一,某种程度上,可以说他已经成为这一行炙手可热的巨星。在人工智能这一新兴领域中,所有来自科技公司、跨国企业甚至国防部的技术精英都是摸着石头过河,渴望聚在一起互通有无。
但另外两个AI巨匠早已各有所属,Yann LeCun 和 Geoffrey Hinton 此前分别加入了 Facebook 和谷歌。而现年 53 岁的 Yoshua Bengio 却选择在蒙特利尔大学潜心教书。“我希望继续保持中立的位置,”Bengio 说道,咽了一口茶水,他的书桌上堆满了各式各样的文件,显得杂乱无章。
Bengio明白,他目前的处境就像上个世纪的核科学家一样——他所发明的工具威力无边,但必须经过深思熟虑和精密统筹才能用得恰到好处。他说:“我们不希望那么一两家公司,名字我就不提了,在AI行业称霸”。他抬起眉毛,暗示我们都知道他所指的是哪家公司。左眉毛表示门洛帕克(Facebook 所在地),右眉毛表示山景城(谷歌总部所在地)。“这对研究AI的大环境没什么好处,对人类也是。”
这就是 Bengio 最近选择签约微软的原因。
是的,微软。他押上自己,赌原来的Windows之王有能力跻身成为AI的第三巨头。微软集资源、数据、人才于一身,最关键的是,它的企业愿景与文化不仅关注科学能带来的成果,也推动了科学发展。 Bengio 1月份在全行业的瞩目下,就职微软成为一名商业顾问。他的加入为微软指明了AI行业最先进的思想、人才和发展的方向。而且这也是掷地有声的宣言,微软实际上将AI领域二强对峙的情况重新拆分组合为三足鼎立。
游说 Yoshua Bengio加入微软的人,在这位深度学习巨匠旁劝解了数月之久,就像为球队寻找明星的球探一样使尽了浑身解数——这个人就是一头灰发,戴着细框眼镜的沈向洋。“他终于来到了微软,就在这个房间,”沈向洋说道,笑容简短而意味深长,表示他明白对于一个外行人而言,可能难以理解自己这番三顾茅庐的行为。
沈向阳
沈向洋这些年来一直在辅佐现任CEO Satya Nadella,这位CEO曾拍胸脯保证将微软转型为人工智能公司。2014 年 3 月,Nadella晋升CEO后第一个月,沈向洋就向微软高层下达了第一次指令。
从一开始,沈向洋、Nadella和另一名同事陆奇就经常会聚头商讨人工智能战略,这些计划也最终催化了AI技术成为微软产品的一部分。随后在 2016 年 9 月,沈向洋将微软产品部门与研究部门合并,成立了人工智能研究组。这个新成立的部门涉及微软三大产品线:Windows、Office 和云计划 Azure。沈向洋的期望是:“我们可以通过这种形式催化研究成果转化为产品。这样消费者们就能更快地获得由人工智能带来的便捷了。”
对于微软来说,成果转化这一过程不可有一丝懈怠,所有科技公司都在紧锣密鼓着要将人工智能引入其产品和服务。除Facebook 和谷歌外,IBM、Amazon 和苹果都认为它们的未来建立在深度学习之上。陆奇离开微软之后,很快成为了中国的人工智能领先公司百度的首席运营官。
最大的讽刺是,微软曾是人工智能领域的领导者。20 世纪 90 年代的微软吸引了语音识别和计算机视觉领域的顶尖学者,但后来十几年间止步不前。一个曾经计算机界的霸主只能眼睁睁地看着的后期之秀们占领移动和云端业务,而这些功能才是我们现在学习工作的主要工具。
微软的研究者们曾经故意把自己孤立起来,好做些不用考虑市场的白日梦,但这样做的成果不过是些胎死于实验室的试验品。比如,比尔·盖茨曾在 1998 年展示过的数字地图技术,再没在市场露面。相比之下谷歌则在 2005 年启动了谷歌地图。而在这段时间里,人工智能的研究也停滞不前。由于计算机硬件能力和数据量的不足,研究者们难以找到突破口。
人工智能先于微软从漫长的寒冬里复苏了。 Facebook 和谷歌在 2013 年分别聘请 Yann LeCun 和 Geoffrey Hinton 准备大干一场时,这家位于西雅图的科技巨头却不似之前的高调了。微软错过了移动时代,在云业务上也步步落后。它的竞争对手们在深度学习领域鼓足干劲时,微软仍沉溺于过去,它豪掷 70 亿美元收购了曾经的智能手机之王诺基亚,这一举动后来被证明大错特错,而微软高管仍然在 Redmond故步自封,其结果就是继续使用其软件新版本的用户越来越少,转而投向其他云产品创业公司的怀抱。
风险投资公司 Andreessen Horowitz 的分析师 Benedict Evans 当年曾写过一篇题为“微软的迷失(The Irrelevance of Microsoft)”的文章。与此同时,硅谷的科技企业也常去微软挖墙角。扫一眼现在机器学习领域的著名人士,几乎都在微软工作或学习过的经历。
随后在 2014 年初,微软提拔了一位性格内向的工程师Satya Nadell,他整个职业生涯可以说都是在微软度过的。大多数人或许认为,只有和微软毫无关联且没被微软的企业文化影响过的领导人才能为这家公司带来意想不到的改变,Nadell颠覆了这些人的看法。他简单阐述了自己对于计算机未来的愿景,和上下级都有着不错的伙伴关系,并恢复了微软作为一家科技公司应有的紧迫感。三年前,在提到科技巨头时,没有人会说微软,而今天,它已经亮眼到令人无法忽视。
但是微软若想杀出重围,要做的不单单是超越亚马逊的云服务,或是说服所有人尝试 HoloLens AR 设备。正如网络的出现重构了所有之前的商业模式一样,现在人工智能正在重新定义计算的未来。
就是为什么扎克伯格去年将设计个人AI助理作为年度挑战(他写代码很有两把刷子);也是 Sundar Pichai(谷歌 CEO)之所以在过去两年的谷歌开发者大会中不断推广“从移动优先到人工智能优先”理念的原因。
人工智能优先的世界里,会有好几家公司都来分杯羹。沈向洋要做的就是保证微软成为其中的一分子。“在这个行业生存,你会明白慢半拍没什么大不了的,”沈向洋说道,“但这次再慢就有大麻烦了。”
即使时至今日,人类最先要学会的仍是使用电脑。我们已经学会了下载 App,记住常用软件常用功能的操作。而人工智能的使命是让计算机反过来学会理解我们。我们不再需要拿起手机,而是发布一系列指令来完成任务。现今社会中,计算机融入了我们周围的环境,触手可及。要像达到这种效果,我们需要一个引路人——一个聪明的对话者,它可以用简单的书面或口头语言帮助我们探索这种全新的,强大的生活方式。微软称其为 Cortana。
Cortana是一款不太主流,然而功能更强大的Siri版本,它比Google助手更具魅力,比Alexa的曝光率低得多。 它最初搭载Windows手机发布,这几乎保证了没有人会使用它,但在一年之内,它的载体便扩展到更广泛的Windows产品。 去年,微软开始大力推广Cortana(是的,微软甚至开发了适合iPhone的应用)。由于Cortana大量搭载于Windows硬件,根据该公司的数据可知,每月其活跃用户达到了1.45亿。
这远远超过了用户不到1000万的亚马逊Alexa。 但不同的是,Alexa主要响应用户声音,而Cortana也能对文本做出了回应,并且可用于许多人手上已拥有的产品。使用Windows工具栏顶部的搜索栏插件的用户都使用了Cortana。
Yoshua Bengio
苹果可能是第一个推出语音助理(Siri)的公司,而 Cortana 却能在用户日常生活中事无巨细。事实上,Cortana 与微软的产品完美贴合。其中搜索引擎必应(Bing)受益最大,必应推出时间已经超过八年了,尽管它的品牌形象仍显不足。然而,Cortana 的影响比你想象得广泛得多。
基本上,只要和谷歌有竞争关系的大型科技公司都与微软存在合作,使用必应的搜索产品。这就是说苹果 Siri 和 Spotlight 的背后是必应在提供服务支持,亚马逊 Kindle 也一样,紧随其后的还有雅虎、Verizon、AOL。
美国大约 30% 搜索需求目前都是由必应满足的。“我们手握大量的设备,也就是数据的来源,这就是 Cortana 如此强大的原因。”Cortana 设计主管 Emma Williams 说道,“事实上,谷歌如果能真正了解世界所处的情况,才是唯一可以和我们竞争的公司。”
如果Cortana是微软的前锋,那么chatbots便是巩固江山的后来者。它们都是的AI小软件,旨在自动化完成用户一般自己操作的任务,例如晚餐预订或银行交易,或者像Marcus说的那样,在会议之前确保投影机正常放映幻灯片。
“bot是一种用来与之交流的软件,这意味着它必须拥有语言理解的能力。”一头长发,戴着彩色围巾的研究员 Lili Cheng 说道,她是交叉学科实验室 Fuse Labs 的一员。
Lili Cheng 最近刚晋升为企业副总裁,负责运营bot 架构和认知服务团队。bot 是微软向开发人员提供的包含29种服务的工具包,如计算机图像和语音识别。她从苹果跳槽到微软后,一直从事交互技术开发,并创建了一个图形化界面来制作漫画。
“chatbot从Internet Explorer 3时期就开始开发了,”这意味着那是1996年。Cheng也算久经沙场,甚至她这样高段位的人也对chatbot发展的速度感到惊讶。她提到了最近在开发者大会上对会计和金融公司开发者的演讲。chatbot在一年多时间内的发展成果是惊人的,我们已经完成了突破。”Lili Cheng 说道。
Emma Williams, Marcus Ash, 以及 Lili Cheng
Lili Cheng 喜欢研究人们与电子产品谈话的方式,以及设备如何回应。沈向洋已经把微软的人工智能研究团队划分为四个板块——产品、早期产品、早早期产品和研究,Lili 四方面都有涉猎。现在,她的主要方向是第二块:“我们见证了 bot 和 Cortana 从概念到产品的过程,但它们目前仍然只是早期形态的产品。”
Cheng 除了设计Bot 工具包用于开发者外,还领导了微软开发了自己的聊天机器人。公司可以观察 Bot 和人的交流过程而学习到很多人机交互的知识。老实来说,这些机器学习过程带来了良莠不齐的结果。还记得微软种族歧视的机器人 Tay 吗?它于 2016 年 3 月亮相于 Twitter、Kik 和 GroupMe,但在 24 小时内,它吸收了很多种族歧视类的言论,并被诱导着说出了像“希特勒是对的”这样的话,微软因此很快就将 Tay 下线了。六个月后,Cheng 发布了一款名为 Zo-on Kik 的新一代的 PG 级机器人。
不久之后,当有人问 Zo 怎么看待希特勒,它会回答“我真不想去那里:(”。问她年龄,它会说“看着像22岁不就行了”。问她最好的朋友是谁,她会回答说:“人太出名就容易寂寞,逗你啦”。
Zo 就像西方版的小冰,17 岁的中国聊天机器人小冰自从 2014 年推出以来就吸引了 4 千万的固定用户。小冰在中国是个社会名人,就像日本的Rinna 一样。有四分之一的用户都在聊天中说过他们很喜欢小冰。
微软推动人工智能发展重要的贡献是人才。和其他大型科技公司一样,微软也疲于重新培训 javascript 入门的工程师。为此微软专门建立了一所人工智能学校,课程安排从哲学与伦理学到建立循环神经网络索索不保。(其中最热门的为 AI-611 Advanced Project,10个席位的课程共收到 530 份申请)。
但微软也在和学习人员建立学校以外的联系。18 个月前,Nagraj Kashyap 创立了一家早期风投公司,想要与创业阶段的学术派、企业家建立更好的关系。这段时间,Kashyap 在蒙特利尔呆了很长一段时间。去年 12 月,Kashyap 领投 Element AI 的首轮融资,这是 Bengio 联合开创的AI公司孵化器,旨在鼓励研究员、企业家创立人工智能公司。微软也参投了 Element AI 这个月初刚公布的第二轮 1.02 亿美元的融资。
早些时候,Kashyap曾将目光投向了人工智能界的宠儿:Maluuba。Maluuba 在蒙特利尔的实验室与麦吉尔大学仅仅相隔几个街区,实验室成员很少有年龄超过 30 岁的。该公司是滑铁卢大学的几个学生于 2011 年创建的,他们大二共同上一门计算机科学课程,从那开始就一见如故。Maluuba让机器变得“有文化”,它能从文本中推理出含义,并基于文本回答问题。
Malluba 将技术授权给三星这样的公司后很快就有了现金流,从此也开始了向深度学习研究投入的漫漫长途。2015 年,Maluuba 创始人签约任用 Bengio 作为顾问。“Sam是一个很有趣的人,”Maluuba 的CEO Sam Pasupalak说。“他在几年前就很有胆量放长线钓大鱼,当时他正面临给客户交付对话软件的压力,仍尝试使用最新技术来构建可以理解和谈话的软件, 这对企业家而言可不寻常。”
一年前,Maluuba创始人将总部迁往蒙特利尔,距离Bengio更近了。
由于Kashyap从高通时代就认识Maluuba创始人,所以在微软任职后能够直接与他们约见。该公司正准备筹集新一轮资金,Kashyap提出了一个诱人的选项:“我当时说,‘我们应该买你们公司!’”
Pasupalak看过了不少公司的报价,经历了令人头大的几星期比价之后,权衡了保持公司独立的各种利弊。最后,选项变得清晰明了。微软把这个宠儿抱回了家。
该团队希望使用微软的数据。“我向Satya提到过,微软拥有世界上最大的文本数量。多年来我们能利用的只有数量很小的数据,只能想尽办法充分利用有限的数据,因此数据对于我们就如黄金一样。”Pasupalak说。
然而,Maluuba团队并没有退缩到雷德蒙德。相反,就在本周的这个星期,它搬到了一个更大的办公室,在微软和本吉奥的协助下,它的目标是在今年年底之前翻一番。蒙特利尔正在成为AI人才的全球热点,微软希望扎根于这个城市。
这一切都是为了确保人工智能帮助触手可及。用户需要计算辅助时——无论是想要个性化的医学方案,想要自动驾驶汽车,还是要记录侄子和侄女的生日——微软都将成为得力助手。 Maluuba的机器学习可以令Zo能够与十几岁的用户进行更直观的对话。这些对话将作为Cortana算法的学习数据,并帮助开发人员创建新的认知服务。而且微软还关爱艾滋病患者,希望能为其生活带来便利。
Bengio 提到,微软的语言能力非常好。但是他没有再拍胸脯保证,毕竟这是微软过去曾经的一贯形象。“我想现在大家都在力往一处使,而且这些大家在细节上都能体会得到,对吧?”他说。他确信微软现在是个强大的竞争者。