“长远研究”和“短期应用”两大实验室双剑合璧,能否支撑起Facebook称霸人工智能的雄心?(上)
彻底开放的文化能否帮助 Facebook 在 AI 方面赶超 Google 和微软等巨头,从而打造全世界最强大的 AI 平台呢?
Facebook 公司内部有很多文化标语,它通常会将这些文化标语张贴在办公室的各个地方,这些文化标语包括 “Code wins arguments”(代码胜于雄辩)、“Move fast and break things”(快速行动、破除陈规)、“Stay focused and keep shipping” (保持专注,持续发布)和 “Done is better than perfect”(比完美更重要的是完成)等等。
在 Facebook 位于纽约的办公室的墙上还有这么一个标语:“Always be Open”(一直保持开放),这个标语完美诠释了 Yann LeCun 所领导的刚创办不久的人工智能和机器学习团队的理念。要想实现进一步扩张,人工智能是 Facebook 不可欠缺的重要组成部分。目前,人工智能已经被 Facebook 用于识别照片里好友的脸部和筛选 Facebook 里的信息流。就在上周,Facebook 刚刚发布了人工智能引擎 Deep Text。Deep Text 能够以接近人类识别的精确度识别用户在 Facebook 上发布的所有聊天信息的意思,每秒能识别数千条信息,能够识别 20 多种语言,Deep Text 的目的就是为了从 Facebook 上的海量内容里找到人们感兴趣的内容,同时过滤清除掉垃圾内容。很快,Facebook 就能将平台上的信息自动翻译成数十种不同的语言。此外,Facebook 还在研究如何辨别声音以及识别视频里的人物,从而能够对海量视频中出现的人物进行识别和标注,方便用户根据人物搜索视频。
人工智能领域的后起之秀
Facebook 希望自己能够在人工智能和机器学习领域占据主导地位,就像它在社交网络和即时通讯领域占据主导地位一样。目前,Facebook 已经招聘了超过 150 个人专门致力于人工智能和机器学习技术的研发。为了提升这方面的研发能力,Facebook 将自己在这方面的投入增加了三倍,不过它并未透露具体投入多少资金。
如果说上一个计算时代的移动云的时代,那么下一个计算时代将是人工智能的时代。Nvidia 是全球最大的图形处理器生产商,同时也是 Facebook 在开源硬件设计领域的合作伙伴,Nvidia 的 CEO Jen-Hsun Huang 这样说道:“人工智能是过去 20年 里在技术方面的最重要发展,Facebook 和其它很多科技巨头将展开激烈角逐,确保让人工智能成为自己的一项核心竞争力。”
然而,Facebook 正式进入这个领域的时间还不到三年,所以要想和其它进入这个领域已经很久的巨头公司竞争,Facebook 所需要的不仅仅是资金,毕竟人工智能是目前最热门的科技领域之一。Pedro Domingos 是华盛顿大学的计算机科学教授,同时也是《The Master Algorithm》这本书的作者,他表示:“在人工智能领域,Facebook 是绝对的后来者,像 Google 和微软这样的大公司已经在人工智能领域耕耘很长时间了。” 在 Mark Zuckerberg 今年1月 份宣布将开发能控制家庭环境的人工智能助手计划前的很长时间,其它大公司就已经开发出了自己的人工智能软件。
微软从 1991年 就开始在机器学习方面进行研发投入了,公司目前有数百名科学家和工程师在数十个与机器学习相关的领域开展研发工作。Google Assistant 是 Google 在深度学习领域的核心研发成果,它未来将成为 Google 大部分 App 和服务的前端大脑。早在 2014年,中国的搜搜引擎巨头百度就从 Google 的深度学习项目里挖来了深度学习领域的大牛吴恩达(Andrew Ng)来担任自己的首席科学家。非盈利性人工智能公司OpenAI目前也已经从特斯拉创始人 Elon Musk 和其它一些科技巨头那里获得了 10 亿美元的研发资金。Amazon 的 CEO Jeff Bezos 前不久在 Code 大会上透露,公司已经在幕后秘密研究人工智能 4年 时间了,公司目前已经有 1000 人专门投入到语音识别生态系统的研发中。此外,包括苹果和 Uber 在内的很多其它大公司也都在人工智能领域进行了大量投入,而且都在竞相挖这个领域里为数不多的技术牛人。
两大实验室协同配合:FAIR 致力于基础科学和长期项目的研究,AML 致力于将科研成果应用到产品里
上面所有这些公司在人工智能领域的大规模投入能很好地激发这个领域的创新浪潮,LeCun 也是其中的一员。在加入 Facebook 之前,LeCun 就被外界公认为是人工智能领域成就最大的科学家之一。在 LeCun 加入 Facebook 后,Facebook 从一个正规的人工智能研究实验室也没有到现在发展为拥有两个正规的人工智能实验室,其中一个是由 LeCun 本人领导的 Facebook 人工智能研究项目(Facebook’ s Artificial Intelligence Research,简称 FAIR),这个实验室项目主要致力于基础科学和长期项目的研究。另外一个是应用机器学习部门( Applied Machine Learning,简称 AML),这个部门由 Joaquin Candela 领导,Candela 是一位经验非常丰富的机器学习领域的专家,他还在剑桥大学创建了一门这方面的课程。他带领的团队的主要工作是找到将人工智能和机器学习领域的研究成果应用到 Facebook 现有产品里的方法。
FAIR 和 AML 是 Facebook 内两个各自独立的部门,LeCun 和 Candela 都直接向 Facebook 的 CTO Mike Schroepfer 汇报工作。这里存在的一个挑战是如何让这两个团队很好地协同工作,将长期项目研究成果应用到短期的商业目标中去。Facebook 采用的方法是:让这两个团队的办公场所紧挨着。LeCun 表示:“这两个团队之间必须要建立起人际关系,而且必须要非常紧密地协作。”
在 Facebook,这两个团队不仅紧挨着办公,而且他们的办公场所就在 Zuckerberg 和 Schroepfer 的办公室的旁边,从这个细节可以看出 Facebook 对人工智能和机器学习的重视。
然后不会因为你坐在谁谁谁的旁边办公就能让有效利用深度科学这项任务变容易一点。要想知道 LeCun 和 Candela 打算如何系统发挥作用,你首先需要了解这两个人的背景。
Facebook 人工智能研究实验室(FAIR)
Yann LeCun 是全世界最顶尖的深度学习专家之一。在他的位于纽约大学计算机科学学院办公室的门上,贴有一个竖起大拇指的蓝色大 logo,不过这并非他自己贴上去的。近日,他穿着海军蓝 polo 衫,衬衫上印有爱因斯坦头像,头像上有 “THINK” 这个词,他说当他两年前宣布加入 Faceboo 时,不知道谁就将这个 logo 贴在他办公室的门上了,不过他自己一直没有拿下来。
(图中人物为 Yann LeCun)
今年55 岁的 LeCun 限制依然是纽约大学计算机科学的兼职教授。如果他站在人群里,你绝对猜不到他是目前全世界最大的社交网络公司 Facebook 的人工智能雄心计划的带头人。如果你曾在 ATM 机上取过钱的话,那么你就已经感受到 LeCun 的研究成果在实际生活中的应用了。深度神经网络目前依然应用在银行和 ATM 机上,这完全得益于 LeCun 在上世纪 80年 代中后期和 90年 代初的研究成就。
作为深度学习的分支卷积神经网络(convolutional neural nets)的奠基人之一,LeCun 是人工智能行业的大明星。卷积神经网络如今被认为是开发可拓展自动化自然语言处理、图像识别、语音识别和视觉搜索系统工具的构建模块,所有这些对于 Facebook、Google、百度和微软等大公司都至关重要,例如,卷积神经网络可以帮助 Google 在安卓手机上开发语音识别系统,而百度则可以利用它开发全新的视觉搜索引擎。LeCun 在这个领域的工作重点是致力于复制生物视觉皮质工作原理的模型。
LeCun 在 Facebook 被赋予了很大的自由,不管是招人还是打造组织架构,他都可以按照自己认为合适的方式打造 FAIR。Zuckerberg 和 Schroepfer 赋予 LeCun 这么大的自由是有足够的依据的:LeCun 曾在贝尔实验室工作过 14年,在多年的工作中已经培养出了一种直觉能力,知道什么事可行,什么行不通。而且他过去也一直在思考,如果有机会创建一个新的研究实验室,他会怎么做。
LeCun 坚信,成功的关键在于秉承开放的理念。LuCun 的行业工作经验和学术生涯都以这样一个开放的理念为基础:科研人员应该发布自己的科研成果、在学术会议上演讲、与学术界的其他科研人员广泛交流探讨以及将代码开源放在像 GitHub 这种开源社区里。
“我身边有很多朋友,他们从具有开放文化的科研实验室跳槽到一些大科技公司后,便开始试图改变新加入公司的文化,想让公司文化变得更加开放,结果无一例外都以失败告终。” LeCun 这样说道。在决定是否加入 Facebook 之前,LeCun 问 Facebook 的一个最重要的问题就是 Facebook 是否致力于打造一个开源的世界和一种开放的文化。
此外,LeCun 还想在做科研与将研究成果应用到产品中这两者间寻求一种平衡。他发现很多科技公司在这方面做得都很糟糕,要么是科研成果没有得到实际应用,要么过于追求眼前效益而导致科研人员无法集中精力研发。其中的一个非常典型的例子就是施乐帕克研究中心研发的图形用户界面,施乐没能有效运用这项伟大的技术,后来在乔布斯 1979年 拜访施乐后,将图形用户界面运用到了苹果的 Lisa 和 Macintosh 里。
LeCun 之前曾见过复合式研究模式(hybrid research)的失败,在这种模式下,科学家被插入到工程团队里,这种模式只会阻碍科学家的创造力。除了这种模式外,有的公司采用的是另外一种模式,就是将科学家隐藏公司内部的空中楼阁里,他们很少与公司的其他人员交流,这维护了科学家的 “尊贵” 身份,但对公司并无其他益处。
在 2002年 至 2003年 期间,LeCun 曾在 NEC(日本电气股份有限公司)位于普林斯顿的实验室工作过。这个实验室是 NEC 创立的一个非常先进的研究实验室,创立这个实验室的目的并不是要急着研发能够很快就应用到产品里的技术。“NEC 一开始并没有要求实验室为自己的公司开发任何产品。然而突然之间 NEC 提了这种要求,他们告诉实验室人员:他们最好能为公司开发可以使用的产品。就因为 NEC 提了这个要求,实验室的几乎所有成员都离开了,包括我自己。要想打破科研团队和产品开发团队之间存在的屏障是不可能的。” LeCuN 说道。
在 LeCun 的主导下,Facebook 于 2013年12月 正式成立 FAIR 实验室,FAIR 致力于解决人工智能和机器学习领域的长远问题。LeCun 知道,要想同时实现 FAIR 团队工作的长远利益和短期目标,就必须要有一部分科学家和工程师研发能够在未来多年以后影响这个领域的新技术,同时还要有一部分科学家和工程师专注于研发能应用到现有产品里的技术。LeCun 表示,FAIR 团队 70%的工作是长期的科研,30%的工作是短期的产品开发。
“FAIR 是非常开放的。我们公开发布了很多研究论文,同时开源了很多代码。所以我们是整个科研社区里的一个真正的组成部分,因为我们我们想通过自己的努力挑战极限,推动科学技术向前发展,同时确保自己能够掌控当今最先进的技术。” LeCun 这样说道。
FAIR 团队有一个野心勃勃的目标:教会机器常识——也就是让机器能够像婴儿或动物那样去学习。LeCun 表示,FAIR 目前最大的项目是用于对话系统的自然语言理解,这也将成为 Facebook 智能语音助手的基础。
(FAIR 实验室的部分成员)
很显然,现在很多科技巨头都想成为语言助手领域的领导者,其中最著名的莫过于苹果的 Siri。除 Siri 外,还有微软的 Cortana、Amazon 的 Alexa 和 Siri 之父新推出的语音助手 Viv 等。
Facebook 在智能语音助手方面也有自己的计划。去年年 底,Facebook 推出了自己的语音助手 M。而人工智能是 M 的核心,因为要想让 M 能够成功回答用户提的各种问题,它就必须要具备常识。
目前还没有出现能够赋予机器常识的技术。LeCun 相信,要想解决这个问题,不应该通过非常直接的方式解决。相反,你首先必须想办法让机器学会理解文本信息,然后再反过来教会机器有关这个世界足够多的背景知识,这样机器才能理解这个世界。
“如果我说 ‘我无法将这个玩具娃娃装进行李箱,因为它太小了’ 这句话时,你肯定知道这里的 “它” 是指行李箱而不是指玩具娃娃,因为你知道将某件东西装进某件东西的意思。” 但机器是理解不了的,让机器也能达到和人一样的理解水平是 FAIR 的长远目标之一。
让机器掌握复杂的常识和文本理解能力不仅会影响智能语音助手,同时还会对自动语言翻译造成影响,而自动语言翻译功能在 Facebook 扩张国际市场过程中扮演着非常重要的角色。
“翻译是一项非常重要的功能。Facebook 的主要使命就是将人与人连接起来,为了达到这个目的,你要做的第一件事就是确保说不用语言的人在翻译的帮助下能够顺畅沟通。” LeCun 说道。