揭秘Facebook的人工智能机器:AI带来了什么?
(原标题:揭秘Facebook的人工智能机器|Xtecher硅谷)
来源|backchannel 作者|Steven Levy
编译|Xtecher(公号 Xtecher) VickyPan、GeneHe
当被要求领导Facebook的AML――号称“世界最大社交网络人工智能(以下简称“AI”)源泉”时,Joaquin Qui?onero Candela犹豫了。
让Candela犹豫的原因并不是因为这位西班牙出生的科学家――自我定义为“机器学习的忠实拥护者”――怀疑AI对Facebook的贡献度。自2012年加入公司以来,他就负责公司的广告运营,具体来说就是通过运用机器学习方法来发布更相关、更有效的广告。值得注意的是,通过这样的方式,他让团队中所有工程师都使用AI,即使是那些没有受过任何AI培训工程师。这也使得广告部门在机器学习方面的技术更加丰富。但他不确定这样的模式是否在整个Facebook通用,因为数十亿的用户之间的连接是取决于说不清道不明的价值观,而非衡量广告的数据。关于升职,他说,我想说服自己这样做是有价值的。
尽管心存犹疑,Candela还是接受了这一职位。现在,他担任这一职位还不到两年,当初的犹豫不决早就烟消云散,甚至会觉得荒谬。
为什么这么说呢?上个月,Candela在纽约市会议上向工程师们发表讲话。“我要强烈声明,”他严肃的说,“Facebook能走到今天绝对离不开AI。尽管你可能意识不到,但事实是每次你使用Facebook、Instagram或者Messenger,你所有的体验都由AI带来。”
去年11月,我前往位于门罗公园面积广阔的Facebook总部,采访Candela和他的团队。借这个机会,我了解到AI迅速成长为Facebook推动器的原因。到目前为止,围绕Facebook在AI领域的目光主要集中在它“世界级的”人工智能研究组(以下简称“FAIR”)。这个研究组由著名的神经网络专家Yann LeCun带队,竞争对手也集中在谷歌、微软、百度、亚马逊和苹果(最近苹果才公开承认自己参与到AI中去)等该领域的顶尖公司团队。同时,由于突出的行业地位,FAIR也是众多优秀毕业生争相申请的精英AI程序项目组之一。最近,计算机的“读写听说”的能力都有了很大的提升。FAIR作为类脑人工神经网络领域的佼佼者,对此也是贡献巨大。Candela的AML在整个过程中的作用,则是负责将FAIR和其他研究组的成果整合到Facebook的实际产品中。更重要的是,公司所有工程师都在AML授权下完成机器学习与自我工作内容的整合。
正因为没有AI,就没有Facebook的今天。所以它更需要所有的工程师为AI添砖加瓦,竭尽全力。
我的采访恰好在总统选举后的第三天,也是CEO Mark Zuckerberg公开否认“Facebook散布虚假新闻助选Donald Trump”这一丑闻的第二天。这否认将Facebook置于水深火热之中,愤怒的舆论称Facebook把杂乱错误的信息公布于众大大降低了Feed新闻民众眼里的可信度。虽然成千上万的恶评已超出了Candela可掌握的范畴,但他知道最终Facebook终将凭借机器学习摆脱虚假新闻。在这个过程中,他的团队是必不可少的一员。
为了减轻接受采访公关人员的压力,Candela向我们介绍了他们小组的某项工作成果。令我惊讶的是,这看起来像是一次不成熟的作品秀。该技术的理念是,采用照片或一系列视频形式重现某位艺术大师的作品特点。事实上,我在Snapchat看到过类似技术,而且也有利用Snapchat将照片调成“毕加索风”的成功案例。
“这背后的技术被称为神经风格转移,”他解释说,“我们通过训练一个巨大的神经网络,使其采用特定的风格完成原片绘制。”他拿出手机,拍了一张照片。轻击并滑动后,照片明显偏梵高的“星夜风”。令人印象更为深刻的是,通过稳定的数据流,它可以改变视频的初始风格。他说,支撑这项技术的是Facebook建立的神经网络,因此完全可以在用户手机的Facebook app上运行。
这样的技术终于被实现了。苹果以前曾骄傲的宣称,它可以直接在iPhone上进行神经运算。但是,这项“骄傲的成果”跟Facebook如今的成果相比就是小巫见大巫。因为,Facebook在进行神经运算的时候不是通过硬件控制。Candela说他的团队可以完成这项艰难的任务全靠团队日积月累的努力。每个项目的成果都为下一个项目的建立打下了基础,同时,参与每个项目的构建又为工程师们提供建立类似产品的培训,这反过来又进一步的加速了项目完成。“从开始到项目公开测试,我们只花了八个星期。这在常人眼里就是神话。”他说。
他说,完成这项被认为“不可能完成”的任务的另一大秘诀是协作。同时,这也被认为是Facebook公司文化的支柱。就因为这样的公司氛围,他可以毫不费力的与公司内部其他部门取得合作,特别是熟悉iPhone硬件的移动团队。这样,他的项目就可以顺利完成从Facebook数据中心成像到手机app成像的跨越。以上这些不仅仅允许你的朋友和亲戚随意将视频调成“尖叫风”(爱德华孟克的作品),而是使所有的Facebook功能都更为强大。短期内,这有助于Facebook提高语言解释和文本理解方面的反应速度。而长远看来,它可以实时分析你所看和所说的内容。“我们在谈论秒,不到几秒钟――这必须是实时的,”他说,“我们是社交网络。如果我预测人们对事物的反馈,‘我的系统’也需要立即反应的,对吧?”
Candela又看了看他刚刚拍的“梵高风”自拍,嘴角露出满意的微笑。 “通过在手机上运行复杂的神经网络,每个人用手机就可以使用AI,”他说。“这不是巧合,是我们在公司内部实现民主化的一部分。”
他还补充道:“这是一个漫长的旅程。”
Candela出生在西班牙。在三岁时,他举家迁往摩洛哥。在摩洛哥,他进入法语学校学习。虽然在自然科学和人文科学方面,他的成绩都名列前茅,最终他还是决定在马德里上大学,并如愿以偿的进入他能想到的最难的专业“电信工程”学习。这不仅需要熟练掌握诸如天线和放大器等物理仪器,还要学习“炫酷的”数据分析。他落在一个教授的解构自适应系统的教授的咒语。Candela建立了一个通过智能筛选来改善漫游手机的信号系统。这被他称为“初级神经网络”。令他着迷的不是简单的代码罗列,而是训练算法。加深这一迷恋是在2000年的丹麦,他得以师从机器学习界传奇人物Geoff Hinton的弟子Carl Rasmussen。快要毕业时,Candela本打算加入宝洁的领导计划,却收到Carl Rasmussen向他发出的攻读博士学位的邀请。于是,他毫不犹豫的选择了机器学习作为专业。
2007年,他在英国剑桥的微软研究实验室工作。加入不久,他就得到一次很好的机会:微软即将推出Bing搜索引擎,但需要改进搜索广告的关键组件,从而准确预测用户何时点击广告。公司决定开展内部投标,获胜团队的解决方案将会和产品一起发布。同时,团队成员将获得一次免费的夏威夷之旅。共有19支团队参与比拼,Candela则获胜最终胜利。虽然他得到了这次免费的旅行,但当微软没有采用他的算法时,他还是觉得自己被骗了。
接下来发生的事情彰显了Candela的决心。他开启了一段被称之为“疯狂的远征”的活动,并成功赢得最后的胜利。他总共举办了50次内部演讲,同时建立了一个模拟器来运行他的算法,以体现他算法的优势。而且,他还跟踪负责此项目的副总裁去吃自助餐甚至上厕所,同时极力向他推销自己的算法。此外,他搬进了行政部门附近的一个废弃的办公隔间,然后毫无征兆的闯入副总裁的办公室,辩称承诺就该被实现,而且他的算法确实更好。
2009年,Candela的算法与Bing一起发布。
2012年初,Candela拜访了在Facebook工作的朋友,并在门罗公园度过了一个周五。这时他惊讶的发现,在这里,人们是自发的去工作,完全不需要监督。之后的一周,他周一参加面试,并在周五拿到录取。
加入Facebook的广告团队,Candela的任务是领导成员为用户提供完美匹配的广告。虽然之前的系统也使用机器学习,“以前的模型太简单了。”Candela说。
同期加入Facebook的工程师Hussein Mehanna同样惊异于公司匮乏的AI构建。“Facebook的产品体验让局外人误以为其已经技术成熟,”Mehanna说。“然而它缺少与时俱进的机器学习平台,我们需要合适的软件来帮助机器从数据中更有效的获取信息,完成学习。”(现担任core machine learning负责人的Mehanna和本次接受采访的其他几名科学家都是从微软跳槽过来的,这是巧合么?)
随着时间推移,人们对机器学习的理解已经从上世纪单纯的思维机器演变成基于模仿大脑活动的模型。就广告而言,Facebook需要通过机器学习得到即时又准确的点击率预测结果。Candela和他的团队已经着手建立基于机器学习程序的新系统。整个系统将作为一个可以推广和复制的平台,方便该部门工作的工程师访问。
机器学习系统的重要组成部分是大量的高质量数据,而这恰好是Facebook最大的资产之一:每天有超过十亿人使用Facebook,因此产生的用户行为样本数据足够广告团队研发新模型,并有效缩短研发周期。 Candela表示,Facebook内部的多个团队将共同协作完成这一机器学习平台的构建。完成的步骤也十分简单:专注产品性能,专注产品效用,关注用户群体。
Candela团队的机器学习系统在点击率预测、点赞、转发次数等方面取得了令人难以置信的成功,证明了Facebook的广告系统即将革新。FAIR领导人LeCun建议将AI应用于产品,使ML方法广泛地在公司内部传播。“有才华的工程师们总是专注于基础技术,而不是过分关注产品。”LeCun说。
2015年10月,Candela成为新的AML团队的主管,并继续与FAIR广告团队保持紧密联系。
Facebook上新增的照片语音描述就是团队协作的成果。
在过去几年中,实践AI的标准在于系统能否识别场景中的对象或得出一个结论(照片的拍摄场景,室内或室外)。近日,FAIR的科学家们训练系统通过神经网络来定位图中所有对象,从目标对象的位置和照片中其他对象的关系来判断照片的意义,而不是简单分析照片中人物的行为。这项科技是视障人士的福音,他们可以用手指按住图片,让手机读出照片的描述。
Candela姐妹团队表示,他们是科学与项目的纽带。
据Candela表示,AI应用分为四个方面:视觉,语言,言语和镜头效果,这些因素将触发系统里的“内容理解引擎”。Facebook从用户发布的信息中提取数据来构建虚拟现实世界,这些数据包括言语中的情绪,视频中的人像识别等。
Candela透露:AI泛化是必然趋势,随之需要了解和分析的问题也会增多。在这个信息爆炸的时代,明智的做法是建立通用的利他体系,这样有用的资源可以在不同的项目中使用,节约时间和成本。
这样的技术转移大大提升了Facebook提供产品的速度。最早版本的Instagram用户照片以逆时针顺序显示,但是2016年初更新的版本允许用户选择根据相关性对照片进行排序。由于AML已经将机器学习用于Feed这样的产品中,Instagram在几个月内就实现了划时代的转变。“只需要一两个熟练的工程师和几十个应用程序制作团队,你就可以克隆这个工作流程而不必从头开始。”Candela说到。
AML团队的惯例是通过神经网络技术与不同的团队的结合产生独特的功能。“机器学习技术目前来说是我们的核心竞争力,它成功提升了用户体验。”,AML的感知团队的首席工程师Tommer Leyvand说。
最近社交推荐功能异常火爆。其实早在一年前,AML工程师和Facebook的产品经理就已经交流过如何实现这项功能。当朋友向你询问当地有哪些特色餐馆时,应该如何让他迅速掌握这些信息呢?分享小组的初始方案是通过匹配关键词来做到这一点,但由于数据技术过大,测试结果并不精确。小组决定将测试方向转为通过训练神经网络测试模型和用户行为,结果检测到非常微妙的语言差异,由此检测出什么时候什么地方谁在问吃什么或者买什么东西并触发Feed请求推送。机器学习将继续提供支持,计算出用户提供的合理推荐,并在用户的Feed界面中显示商家或餐馆的位置。
Aquino表示,在她就职的一年半里,AI技术飞速发展,已经从概念变成了现实。Facebook创建了Deep Text减轻项目进行的压力,源代码和资源都允许其他团队访问,毕竟不是每个团队都有机器学习专家。(Deep Text主要于增强Facebook翻译功能背后的ML技术)
AML团队为增强用户在Facebook的视觉体验建立了Lumos。Manohar Paluri最先提出这个理念,由正在建立宏大机器学习视觉系统的FAIR进行试验,此机器学习系统被称之为Facebook的视觉皮层,用于处理和解析所有发布在Facebook上的图像和视频。在2014年的一次黑客马拉松赛上,Paluri和同事Nikhil Johri在极短的时间内完成了原型机,并将结果展示给Zuckerberg和Facebook COO Sheryl Sandberg。Paluri与Candela共同领导计算机视觉团队构建Lumos,将视觉皮层的利用率发挥到极致。
Paluri表示,由于工作流程的透明度,Lumos允许任何人参与神经网络,他们可以为特定场景构建模型,并且自主的修改与推动它。
即使完全不是工程师,或者完全不擅长AI,也可以在Lumos系统上进行任务。Paluri向我演示了一个样本任务:提高神经网络识别直升机的能力。面对几乎满屏幕的5000个类似飞行物(甚至包括玩具直升机),我简单点击内置的“训练直升机图像分类器”就完成了任务。
Paluri说,他们的目标是在明年减少100倍的注释。随着需求增大,这样的手动分类终将自动化。因为Facebook追求ML的圣杯――无监督学习,使得神经网络能够自动从图像中找出目标。
从长远来看,Facebook毫无疑问最终会将视觉皮层与自然语言平台融合成一个新的皮层,也就是Candela谈及的通用内容理解引擎。
Zuckerberg在关于社区建设的5700字宣言中七次提到了人工智能,他表示,机器学习和其他技术都是为了帮助和保持社区安全而存在,Facebook作为一个为社会利益工作的公司有这样的愿景至关重要。
目前Facebook正在解决如何训练系统推送用户最需要的信息的问题,作为十亿用户的主要信息来源,随机显示用户不在意的新闻过于浪费时间,朋友发来的消息也是逆时钟显示,无法凸显某一条推送的重要性。Candela满怀信心的表示,他们将采取一系列的研究来优化当前机器学习和AI的探究水平。
推送虚假新闻一度将Facebook置于舆论的风口浪尖。事实证明,识别假新闻与找到人们最想要看到的内容没有区别。FAIR团队World2Vec模型(“vec”是技术术语的缩写,矢量)的诞生有望解决这个问题。World2Vec为神经网络增加了记忆能力,并帮助Facebook标记每一条内容的信息,例如其起源和共享的内容。有了这些信息,Facebook可以了解假新闻的分享模式和来源,进而使用机器学习策略根除骗局。
要分享关于Facebook如何通过算法来减少假新闻的指标还为时过早。Candela解释说,这些试验品的实际表现还在观察期,但无论这些新的措施是否有效,这个算法本身也引出了另一个问题――机器学习有可能产生意想不到的负面结果,Candela团队还在为解决这些问题做准备。
一些人认为这些事情只是发生在2016年,Candela对此持反对意见。“我认为我们已经努力让世界变得更好了,”他说,“在面试前一天,我打电话给一个朋友的父亲,此前我们可以说是没有交集。我看到他发布的支持特朗普的文字,感到他的思想已经被迷惑。然后我意识到自己的工作只是根据数据做出决定,缺少重要的信息。所以我给那个朋友的父亲发了信息,之后我们通了电话。这件事没有改变我的本质,却让我从一个完全不同的角度开始看问题。在没有Facebook的世界里,我从来没有与人有这样的联系。”
换句话说,虽然AI技术是必要的,但对于Facebook来讲,这也许不是唯一选择。Candela表示:“我们只是 刚刚开始挑战AI,任重而道远。”