FB首席AI科学家勒坤谈AI未来:机器可通过数据常识了解世界
[ 摘要 ]随着企业继续投资于认知软件能力,AI市场也在蓬勃发展。市场研究机构IDC表示,到2022年,全球在AI系统上的支出预计将达到776亿美元,是2018年预测240亿美元的三倍多。
Facebook首席人工智能科学家雅恩·勒坤(Yann LeCun)
腾讯科技讯 2月19日消息,据外媒报道,Facebook首席人工智能(AI)科学家雅恩·勒坤(Yann LeCun)表示,给机器提供通过数据了解世界的“常识”将是未来十年AI研究的重要领域。这可以使机器在更复杂的环境下做出更好的决定,也可以帮助像Facebook这样的公司更准确地检测仇恨言论。但是,为了提高AI的性能,需要对硬件进行优化。
近年来,世界上许多科技巨头都专注于AI的研发,从谷歌、Facebook到微软都是如此,它们都希望将AI融入到几乎所有的产品中。例如,谷歌甚至在今年的开发者大会之前将其谷歌研究部们更名为Google AI。在这次大会上,AI占据了最前面和最中心的位置。Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)在5月份的F8大会上,也解释了这家社交网络巨头是如何使用AI来打击其平台上的仇恨言论的。
随着企业继续投资于认知软件能力,AI市场也在蓬勃发展。市场研究机构IDC表示,到2022年,全球在AI系统上的支出预计将达到776亿美元,是2018年预测240亿美元的三倍多。
但这个行业仍有很长的路要走,其许多进展可能取决于学术界和行业参与者是否能找到一种方法,以让计算机算法具备类似人类的学习能力。由AI驱动的系统,无论是Facebook用来检测不当内容的算法,还是谷歌和亚马逊开发的虚拟助手,都不能像人类那样推断上下文语境。而这一进展恰恰对Facebook来说至关重要,因为它正在加紧努力,在其平台上发现网上欺凌行为,并筛查与恐怖主义有关的内容。
Facebook首席AI科学家勒坤在最近接受美国主流网络BI采访时表示:“有些情况非常明显,AI可以被用来过滤掉这些情况,或者至少是让人类审查员来决定。但在很多情况下,有大量的仇恨言论,除非你了解更多背景,否则很难发现这一点。因此,目前的AI技术还无法应对上述挑战。”
推进AI领域快速发展的一个关键因素,特别是在深度学习方面,将是确保有能够支持它的硬件。这是勒坤在周一的国际固态电路会议(International Solid-State Circuits Conference)上讨论的一个重要议题。他在会上讨论了一份新的研究论文,概述了芯片厂商和研究人员在未来5至10年内需要考虑的关键趋势。他说:“无论他们建造什么,都将影响未来十年AI的发展。”
在会议开幕之前,勒坤与BI记者讨论了AI的未来发展方向、这对我们日常生活中使用的设备代表的意义、当今AI发展状态以及未来的最大挑战。下面是采访摘要:
1.为了提高AI表现,机器必须在功耗方面做得更好
想象下这样的真空吸尘器:它不仅要足够聪明地绘制出你的起居室地图,以便不会重复清洗同样的地方,而且还能在撞到障碍物之前探测到它们。再比如智能割草机,它可以智能地避开修剪草坪时的花坛和树枝。勒坤表示,除了像Facebook和谷歌母公司Alphabet这样的公司正在投资的技术(如增强现实和自动驾驶汽车),这些设备要能工作并流行起来,需要更加节能的硬件。
勒坤说,这样的进步不仅对这些技术的蓬勃发展是必要的,而且对于改进像Facebook这样的公司实时识别照片和视频内容的方式也是必要的。理解视频中发生的事情,将视频内容转录成文本,然后将文本翻译成另一种语言,以便世界各地的人们能够实时地理解它,这需要“巨大”的计算能力。
2.在其他改进出现之前,我们将在短期内继续看到智能手机取得进步
勒坤认为,未来三年,大多数智能手机将通过专用处理器将AI直接嵌入到硬件中,这将使实时语音翻译等功能在手机上更加普及。对于那些近年来始终密切关注智能手机行业的人来说,这可能并不令人意外,因为苹果、谷歌和华为等公司已将AI更紧密地融入到其移动设备中。勒坤表示,这将使“所有类型的新应用”得以实现。
3.赋予机器以常识将是未来十年AI研究的重点
虽然人类通常通过全面的观察来了解世界,但计算机通常是经过训练来执行特定任务。例如,如果你想设计一种能在照片中检测出猫的算法,你必须帮助它了解猫的长相,方法是用大量的数据进行训练,其中可能包括数千张标记有“包括猫”的照片。但勒坤表示,在接下来的十年里,推动AI向前发展的“圣杯”在于完善一种被称为自我监督学习的技术。换句话说,这种技术能让机器通过数据来了解世界是如何工作的,而不是仅仅学习如何解决特定的问题,比如识别猫。
勒坤补充说:“如果我们真的通过训练算法来做到这一点,那么在机器捕捉上下文背景、做出更复杂决策的能力方面将会取得重大进步。不过,这种技术目前只适用于文本,而不适用于视频和图像。但这样的突破可能是像Facebook这样的公司所需要的,它能提高其平台上的内容协调性,尽管目前还不清楚这一解决方案何时会出现。这不是明天就会发生的事情。”
4.深度学习可能需要全新的编程语言
勒坤认为,深度学习可能需要一种新的编程语言,它比Python更灵活、更容易使用。目前还不清楚这样的语言是否必要,但这种可能性与研究人员和工程师们根深蒂固的愿望背道而驰。勒坤称:“在谷歌、Facebook和其他地方,有几个项目可以设计这样一种编程语言,以有效地进行深入学习,但目前还不清楚社区是否会跟进,因为人们只想使用Python。”
GitHub最近发布的Octverse报告称,Python是目前从事机器学习项目的开发人员使用的最流行编程语言,它是Facebook的PyTorch和谷歌的TensorFlow框架的基础。勒坤表示,AI的崛起与计算机芯片和其他硬件所提供的计算能力的增长密切相关。更好的硬件可以支持更好的算法、更好的性能、让更多人建造更好的硬。
勒坤指出:“可用的硬件种类对人们所做的研究有很大影响,因此未来十年左右AI的发展方向将受到硬件的极大影响。对于计算机科学家来说,我们喜欢抽象地认为自己不受硬件的限制,但事实并非如此。”
勒坤重申了自我监督学习在推进最先进AI发展方面发挥的重要作用。他说:“如果自我监督学习最终允许机器通过观察来学习大量有关世界如何运作的背景知识,那么某种形式的机器常识可能会出现。而未来的深度学习系统将在很大程度上接受自我监督学习的训练,并需要新的高性能硬件来支持这种自我监督学习。这种硬件对Facebook以及无人驾驶、机器人和许多其他形式的技术都很重要。”(腾讯科技审校/金鹿)