解密谷歌2500万美元全球AI影响计划,这三领域最受重视
今天,在谷歌在山景城(Mountain View)召开的年度I/O开发者大会上,谷歌研究小组的高级研究员、谷歌人工智能部门的负责人Jeff Dean,概述了谷歌在努力解决具有挑战性的人工智能和机器学习方面的学术问题。本周二,谷歌推出了2500万美元的全球人工智能影响补助计划,并公布了人工智能技术正在进行的三个可行项目,并以此陈述结束了这次演讲。
Dean围绕美国陆军核心工程师于2008年公布的21世纪重大挑战的清单进行了讨论。其中包括对“空中馅饼”的追求,例如逆向大脑工程、氮循环管理和融合能量提供。还有更实际的目标,如高级健康信息学、让太阳能更便宜、增强虚拟现实等目标。
“如果我们在这些方面都取得进展,世界将成为一个更健康的地方,我们会有更多的科学发现。” Dean说。
为此,他详细介绍了谷歌母公司Alphabet自动化驾驶部门Waymo的研究人员正在进行的工作。自Alphabet’s X skunkworks问世以来的10年里,Waymo的汽车在亚利桑那州凤凰城(Waymo的一次叫车服务的所在地)搭载了1000多个付费客户,累计行驶了1000多英里。在车队里有安全司机,但Waymo在其他没有安全司机的地方也驾驶汽车。
“(我们)正处在我们如何训练自动驾驶汽车在剧烈(变化)的尖端行驶。(汽车)必须做出一系列复杂的决定,比如通过做什么来实现目标,” Dean说。“这真的要归功于我们的深入学习,我们学习了基于节奏的算法,并且可以建立汽车对世界的理解,让它们在现实世界的环境中运行。” Dean说,机器学习在机器人学中有着无止境的应用,尤其是在挑选场景时,这些场景要求机器人操作各种大小和不寻常形状的物体。一项特别的任务——抓住机器人从未遇到过的物体——已经看到了数量级的进步。谷歌人工智能系统在2015年和2016年分别取得了65%的成功率和78%的成功率,研究人员在2018年设法提高到96%。
Dean说:“这是三年来取得的相当好的进展。我们已经浪费了三分之一的时间,你没能找到一些东西——实际上很难把它们串在一起——所以这很令人兴奋。”
另外,谷歌的人工智能团队一直在利用自我监督的模仿学习技术,这是一种人工智能培训技术。在这种技术中,未标记的数据与少量标记的数据一起使用,帮助提高学习的准确性,从而“教”机器人新的技能。Dean描述了一个模型——通过“观看”人类的示范,学会从罐子里倒苏打水。经过15次试验和15分钟的训练,它获得了一个平均8岁孩子智商的倒水技能。
健康是谷歌关注的另一个重要领域,人工智能在为转移性乳腺癌等疾病开发诊断工具方面发挥了重要作用。糖尿病视网膜病是另一个目标疾病,这是有充分的理由——它是全球4.15亿糖尿病患者中增长最快的致盲原因。令人担忧的是,大约 45%的患者在诊断前会有视力下降。
糖尿病性神经病通常由眼底图像识别,眼科医师将其分级为滑动标度。图像中出血的数量越多,疾病的发展速度就越快。
谷歌采用了人工智能系统来读取这些图像,并在2016年出版的《美国医学协会杂志》上发表的一篇论文中证明,该系统可以将图像归类为普通眼科医生的级别。在一年后的一项后续研究中,它提出了一种机器学习模型,可以与经董事会认证的视网膜眼科专家的性能相匹配。
今年2月,谷歌与印度Madurai的Aravind Eye医院合作,在生产中部署了一个模型。
Dean说:“这是护理的黄金标准。”有了良好、高质量的培训数据,你可以训练模型并获得和视网膜眼科医师一样的效果。”
在最近的一项研究中,谷歌人工智能科学家训练了一个人工智能系统,用来寻找视网膜扫描样本中和其他样本不太明显的关系。令人难以置信的是,它预测了诸如性别、收缩、舒张、血红蛋白和年龄等因素,准确率很高——在受试者年龄的三年内,在性别方面准确率为97%,。
“与更具侵入性血液测试同样准确,现在你可以用视网膜图像来进行检测。我们希望,这可能是一种全新的东西。当你去看医生时,他们会给你的眼睛拍照,我们会有你眼睛的纵向历史,并能够从中学习新的东西。”
Dean说,在另一个领域——化学——谷歌正在用高效的人工智能模型超越传统计算。2017年的一个细节在量子化学计算大约快了30万倍,传统上达到这种速度需要一个更昂贵的模拟器。
“突然之间,这意味着你可以做各种各样的科学。你可以说,哦,好吧,我要去吃午饭,我可能要筛选1亿个分子,” Dean说,“这可能很有趣,(而且)我认为它将在许多科学领域发挥作用。”
Dean解释说,这些突破性进展是由神经网络的现代转世所促成的——一组可训练的数学单元,按层组织,共同解决复杂的任务。他们从原始的、异构的和杂乱的数据中学习特性。以前需要大量的手工预处理来处理这些。
像Transformers这样有能力生成类人文本的可扩展架构,以及可以在设备上运行的高度紧凑的人工智能系统,如Google最近发布的GBoard转录模型,都在继续工作。Dean说,公司现在每天在预印服务器arxiv.org上发表近90篇学术论文,他指出增长速度超过了摩尔定律。
“很明显,机器学习将成为科学和工程的重要组成部分。我们的目标是鼓励机器学习模型思想的交流,并将其付诸实践……我认为推动先进技术并将其应用于不同的事物是一项重大的责任。”