谷歌I/O大会机器学习专场:人工智能冬天或再来临
新智元原创
作者 :闻菲 胡祥杰
【新智元导读】 2016 I/O大会的第三天,在喧嚣和狂欢逐渐淡去之时,一场名为“Google 机器学习展望”的对谈今日凌晨在主会场举行。谷歌大脑负责人Jeff Dean与搜索和机器智能部分副总裁John Giannandrea,以及产品高级主管Aparna Chennapragada参与对话。如今TensorFlow和Cloud Machine Learning让全世界的研究人员和开发者都能更好地合作。当下机器学习领域最激动人心的话题是什么?最顶尖的挑战是什么?机器学习的边界在哪里?
过去十年来,谷歌在其各项产品中应用人工智能技术,不断机器学习领域做出重大突破,以越来越快的速度发表愈发有影响力的成果。如今TensorFlow和Cloud Machine Learning让全世界的研究人员和开发者都能更好地合作。当下机器学习领域最激动人心的话题是什么?最顶尖的挑战是什么?机器学习的边界在哪里?在MIT Technology Review资深科技记者Tom Simonite的主持下,谷歌机器学习领域三位领袖展开讨论。
John Giannandrea 是谷歌搜索、机器智能和网页部门的工程副总裁。John负责监管上述部门的产品及研发,同时带领公司一些长期规划的技术项目。2010年,John和Danny Hills共同创立的公司Metaweb被谷歌收购,John 也因此加入谷歌,谷歌著名的知识图谱的基础就是Danny Hills开发的技术。此前John是Tellme Network的联合创始人兼CTO,2007年这家公司被微软收购。John是苏格兰人,毕业于斯特拉斯克莱德大学。
Jeff Dean 1999年加入谷歌,目前是Senior Fellow。他是谷歌大脑项目负责人,参与设计/部署了谷歌搜索和广告系统的重要部件,也是谷歌MapReduce、BigTable、Spanner 和 TensorFlow等分布式计算架构的联合设计师和联合部署人。Jeff Dean在1996年获得华盛顿大学计算机科学博士学位,目前是ACM Fellow、美国工程院院士、AAAS成员。
Aparna Chennapragada是谷歌产品管理高级主管,她在information discovery方面的优势曾让她为谷歌搜索和YouTube做出诸多贡献。她最近领导的项目是Google Now。Aparna Chennapragada拥有MIT管理工程硕士学位,德克萨斯大学奥斯汀分校计算机科学与技术硕士学位,印度理工学院计算机科学学士学位。
对话全程视频
【Tom Simonite 】人工智能和机器学习并不是什么全新的概念,早在多年前就有了,但是现在,忽然地,这两个词被提及的频率增加了。许多大公司都在进行投入,人们也为此感到兴奋。所以即使是一大早,你也能看到很多人过来一起讨论这个话题,那么,能不能介绍一下,到底发生了什么?
【John Giannandrea】 我想在过去的几年,我们看到了巨大的成果,比如在探索了多年的语音识别和图像理解。其中主要原因是深度学习的进步。这不是新事物,人们已经使用很多很多年了,但是近几年发生的几件事让其变得更有影响力。同时,开发者能拿到的资金也变得多了。人们会说人工智能的冬天这样的话,我觉得现在我们从某种程度上来说是在春天了,我们会在许多领域见到有标志性的发展。
【Tom Simonite】 你研究人工智能多少年了?
【John Giannandrea 】 在谷歌,我们是四年前开始的。在语音识别上,我们已经做了十多年了,但是真正把人工智能提上日程,投入大笔投资还是四年前。我们成立了专门的团队来做这件事,比如Jeff Dean领导的TensorFlow。
【Tom Simonite】 对于产品经理来说,人工智能的发展有没有为产品打开新的视野?
【Aparna Chennapragada 】当然。对我来说,人工智能是一种强大的工具,它可以帮助我们解决许多现实的问题。技术门槛下降后,用户的使用率或上升,这是相对应的。语音识别、翻译和图像理解上都是这样。再者,通过手机许多问题都可以转化为AI的问题,比如交通和医疗等,这是很令人兴奋的。另外,在用户体验上,确保用户界面能适用人工智能技术,这一点很重要。
【Tom Simonite】 为什么要把tensorflow开源呢?
【Jeff Dean】 为了获得进步,有必要进行大量的实验,并且要尽可能的快。在几个小时内完成一个实验和在几天完成一个实验有时候有着天壤之别。所以,我们的任务之一就是搭建好的平台,有良好的适应性,能测试大量的创意。这也是为什么会有TensorFlow的原因,它是一个把研究转化为产品一个工具。我们认为这是件很好的事情,人们可以用tensorflow训练模型,而其他人也可以使用这些数据并且在此基础上继续,GitHub上有很多这种资源,差不多提到了1.5万次,其中只有5个来自谷歌。我认为这种思想的自由交流碰撞是非常好的事情。
【Tom Simonite】 Tensorflow目前主要是机器学习老手使用,但谷歌的理想是每个人都会用机器学习。那么,没有什么机器学习背景或经验的人也能使用TensorFlow吗?
【Jeff Dean】 我认为你可以用机器学习去做很多很多的事情。首先是开发算法,这也是机器学习研究人员要做的根本的事情,但这部分人相对而言数量并不多。随着新的算法和模型生成,并且被用于解决特定的问题,这些模型都将具有很强的适用性。例如,使用机器学习做糖尿病诊断,这个问题其实跟很多问题都一样,那就是要在图像中找出异常的部分。类似的,我们也会遇到要在街景图片中找出能够识别的某些文字,而解决这个问题的模型跟要找出——举个例子——眼球里疾病症状的模型可以说是一样的,只是训练所用的数据不同而已。因此,我认为越来越多的人会接触到越来越广泛的模型。此外,还有一种更简单的方法,那就是使用pre-trained API,比如你使用谷歌的云端API,只要把图像提供给我们,我们就可以反馈给你很好的结果了。换句话说,只有是有基本编程经验的程序员,都能够利用TensorFlow已有的这些模块训练他的点子。TensorFlow之所以会受欢迎的一个原因,就是因为它向人展示了6到7种不同的重要机器学习模型,并且让人知道了这些模型的底层原理,也知道了它们是如何在TensorFlow中运作的。
【Tom Simonite】 所有产品发布,每一个新的平台推出以后总是要经历一些问题,这样才能知道哪种交互有效,而哪种交互没那么有用。现在我们也面临这样的问题吗?
【Aparna Chennapragada】 确实如此。就像我们做GoogleNow,我们认识到很重要的一件事情就是根据产品领域的不同,一定要注意我们业内人士常说的“WDH比率”,凡事过犹不及,如果说你在谷歌搜索搜索一位明星,显示出来了不太相关的结果,这算不了什么。但是,如果Google Assistant 告诉你开车去机场,但导致你没有赶上航班,这就是大问题了。因此,我认为控制好 WDH 比率是十分重要的,尤其是在平台开放的早期阶段。另一件我们注意到的事情是,要留意看使用了机器学习的地方问题具体出在哪里,我们要找的是那些对于机器很简单但对人而言很难的任务,并确保这些才是交给机器去做的。
【Tom Simonite】 现在大家都很关注的一个概念是语音交互,我们也见到了这次发布的Google Assistant,但其他公司也做了类似的产品。语音交互一定会成为主要人机交互方式吗?在设计语音交互界面时,其瓶颈和优势分别是什么?
【Aparna Chennapragada】 要做出成功的产品都很难,但在这方面我们已经有了喜人的进展,前不久我们刚刚开源了一个句子语义分析工具,你可以渐渐地开始看见自然语言理解方面的进展,以及在此基础上搭建起来的更多模块。
【Tom Simonite】 John,你是做搜索的,周三的时候我们知道了在美国大约20%的搜索是通过语音完成的,看来公众也逐渐习惯了使用语音搜索。Google Assistant 语音搜索界面也会经历类似的发展吗,比如成为人们日常生活中搜索的一大部分?
【John Giannandrea】 我们认为GoogleAssistant 从根本上是与谷歌搜索不同的一个产品,而且它的使用方法也不同。我们在语音搜索方面工作了许多年,收集了很多用户资料,有证据表明用户喜欢使用语音搜索,可以说使用语音搜索和文字搜索关键的不同点在于搜索的深度,需要回答的问题数目和类型。我认为语言和对话是计算机领域一直以来都没有得到解决的一大问题,现在还没有计算机能够做到阅读完一篇文章然后写一段总结。就像刚刚 Jeff 所说的那样,模型的适用性很强,就像你可以用图像资料训练谷歌照片分类一样,我们对自然语言理解也抱有同样的看法。要实现人和机器之间真正很自然的对话,我们还需要投入很多年的精力,这是一个长期的过程。我们希望Google Assistant下半年发布后,大家都积极使用它,并觉得它好用。至于建立Google Assistant的模型,我们现在专注于打造用户喜欢的产品,因为用户喜欢一个产品,就会继续使用,而使用规模扩大,我们就能从中找到商业模式。
【Tom Simonite】 能够总结一下机器学习的难点和突破吗?
【John Giannandrea】 全世界的研究人员都在努力。其中一个难点是从小数据学习。神经网络通常需要大量数据来训练,相应的训练时间也会很久。相比之下,人类小孩就不需要这么多数据才能学会东西。机器学习的另一个难点是迁徙学习——在这个领域学会之后,应用于另一个领域。
【Jeff Dean】 我认为最近这几年我们在语言理解方面做的不错,比如翻译、语义理解等等。至于难点,我认为是无监督式学习——从没有标签的数据和偶尔一两个有标签、明确其很重要的数据中学习,是机器学习的一大难点。另外我还想补充一点,现在我们需要很多机器学习专业知识,是因为在图像领域我们需要使用CNN,而在语言领域则需要更换模型。有没有可能系统自己设计一种适合的框架,可以自动适应被输入的数据呢?如果能做到这一点,也就是机器能够自己学习,那就是个大突破了。
【Tom Simonite】 你认为如果机器真能自己学习,那么是什么技术突破带来了这个结果?这将会在不久的将来出现吗,还是说要等上很长一段时间?
【Jeff Dean】 要是我知道就好了(笑)。我的感觉是, 并不需要解决很多很多的问题,只要突破了几个关键点,比如开发出新的学习算法,知道世界哪部分重要以及为什么重要,或许就能够解决这个问题了 。
【Tom Simonite】 有什么技术是你希望明天Jeff的团队就给你做出来,然后你可以用它来做更多事情的?
【Aparna Chennapragada】 自动生成邮件?事情是这样的,现在我们有很多模块,计算机感知、机器视觉,都发展到了一定阶段。要我说, 下一个我希望看见的技术突破是机器的手眼协调能力,如果能实现这一点,就打开了很多可能。 我突然想到的一点是助老助残机器人,比如一位80多岁腰背不好的老人,拿东西很不方便,如果有机器能够解决这个问题不也很好吗?此外,还有自然语言理解——作为一个7岁孩子的母亲,为什么世界上没有一个可以跟孩子聊天的机器人呢?
【Jeff Dean】 过去的经验告诉我们,对人来说很难做的事情,我们可以教会计算机去做,但对于人很简单的事情,要教会计算机做就困难了。
【Tom Simonite】 这是否意味着我们的知识链或者研究领域还缺少了重要的一环?
【John Giannandrea 】 我认为机器人很有意思,因为它给了机器学习和神经网络一个在现实世界中“现形”的机会,而在真实世界中与人互动跟在虚拟世界完全是两码事情。
【Tom Simonite】 很多人都对DeepMind非常感兴趣,能介绍一下他们吗?
【John Giannandrea 】 当然。DeepMind是我们在伦敦的一个研究团队,他们尤其关注通过simulation学习,做了很多与电子视频游戏相关的工作,成果也挺多。此外,电子游戏和物理simulation之间的界限其实很模糊的,有的电子游戏实际上是全simulation的。因此也不能说他们只从事跟游戏相关的工作。
【Tom Simonite】 DeepMind的工作会涉及机器人吗?
【John Giannandrea】 他们做的事情挺多,有些涉猎,也有些不会涉猎。
【Tom Simonite】 在周三开幕式上演示的机器手臂,这是Jeff你们团队的工作吧?
【Jeff Dean】 是的。我们组的一个研究员发现机器人团队有20台机械手臂就那么搁在柜子里没有用,我们就说,嘿,我们应该把它们用起来。一般机械团队都只有一个机械臂,因此这样大规模的试验让我们能够尝试很多新的想法。首先就是让这些机械臂抓住东西,这是完全是一个监督学习问题,从摄像头里采集原始图像数据,然后控制电机运转,要是机械臂抓住了目标并将它举起来,那么试验就成功了,否则就失败。而有了20台手臂,相当于经验乘以20,学习速度就更快,同时增加的经验还能在机器之间共享。
【Tom Simonite】 John,你在谈话开始前提到了“AI冬天”,而现在是“AI春天”了。那么“AI夏天”何时到来呢?
【John Giannandrea】 目前还存在很多问题,比如对话,这也是我个人非常关注的一个领域。例如翻译,从一种语言到另一种语言,你需要理解,还需要重新排列组合词汇等等。如果计算机能读懂一段英文,再写出同样意思表述不同的另一段英文,也就是在计算机真正能够阅读理解之后,我认为“AI夏天”才算到来。对此,目前的翻译虽然还有一定距离,但也在某种程度上实现了语义理解、词组排序,因此我还是很有信心全世界的研究人员会实现这一目标。届时,自然语言理解将成为计算机的基本组成能力,能够与人进行对话交流。
【Jeff Dean】 我想补充一点,我认为“春天”和“夏天”之间并不存在很明显的界限。技术发展是一个过程,在各个方向都逐渐推进,有那么一天过了一个临界点,实现了重大技术突破,“夏天”就来了。比方说你4年前问我,计算机能不能看图说话,我会说大概不能,但现在事实证明我们可以做到这一点。
【Tom Simonite】 既然我们不能太好把握人工智能的发展趋势,那么是否意味着我们也可能预料不准“AI冬天”会再度降临呢?
【John Giannandrea】 如果研究止步不前,“冬天”确实有可能来临。 人工智能从业者现今都非常高兴奋,可能有些过火了,但正因为我们看见了这么多的成绩——语音识别正确率大幅提高,图像识别准确率计算机超过了人,在这些细分领域,算法已经超过了人。因此,人工智能相关从业者自然会无比兴奋。