DeepMind回顾2017年:除了战胜柯洁还有哪些大事
(原标题:2017:谷歌DeepMind团队的年度回顾)
上周,百度搜索公布了一份年度搜索榜单,对2017年中文搜索热词进行了盘点。人工智能自然是年度科技事件中的热中之热,共计3项AI相关事件进入年度前十,其中“AlphaGo对战柯洁”一项排名科技榜第一。
日前开发AlphaGo程序的谷歌旗下DeepMind团队在官方网站上撰文,回顾了2017年团队在新的AI技术研发方面取得的发展,以及在AI技术的社会影响方面的作为。
以下为文章全文(由微信公众号“春华财经”翻译):
今年7月,世界排名第一的围棋选手柯洁在20次连胜之后发表了讲话。此时距离他与AlphaGo在中国乌镇围棋峰会上的对弈刚刚过去两个月。
他说:“在和AlphaGo的比赛之后,我从根本上重新审视了围棋游戏,现在看来这些思考对我的帮助很大。我希望所有的围棋选手都能思考AlphaGo对游戏的理解和思维方式,所有这些都是非常有意义的。虽然我输了,但我发现围棋的可能性是巨大的,而且它还在不停地进步。”
△围棋峰会是一个为期五天的围棋盛会。它包括多种多样的游戏形式――双人组队战,团队战,以及像柯洁那样的1:1对战。
柯洁是围棋领域的顶级人物,他的话让DeepMind的研究人员们感到很荣幸。这同时也是对我们的激励,因为这预示着在未来,AI可以作为人类探索的工具;它可以发掘出新的知识,帮人类增进对世界的理解。具体对于AI辅助科研来说,DeepMind也希望AI系统可以在气候变化、新药研发、到发现新型复合材料、降低现有医疗系统的运转压力等等挑战上帮助人类做出进展。
这种潜在的社会效益是当初建立DeepMind的原因,我们很高兴在一些基础学科以及AI安全和伦理方面取得了持续的进展。
科学技术研究成果
DeepMind的研究方法是受到神经科学启发的,神经科学领域的发现帮助DeepMind在诸如想象、推理、记忆和学习等关键领域取得进展。以想象力为例:这种人类特有的能力在我们的日常生活中扮演着至关重要的角色,它让我们能够规划和思考未来,但这对计算机来说却极具挑战性。
DeepMind 持续地在这个问题上进行深入的研究,今年也研发出了带有想象力的智能体,它们可以从环境中提取出有用的信息,然后对未来应该做什么做出规划。
正是沿着在神经科学启发下做研究的思路,DeepMind尝试训练了一个神经网络,来控制虚拟环境中各种简单形体的运动,得到了走路非常妖娆的智能体,这项研究的训练成果的视频也是DeepMind历来最热门的一次。这种复杂的运动控制是运动智能的一个标志,也是DeepMind的研究计划中的重要部分。虽然最终得到的运动姿态是狂野的,有时是笨拙的,但他们也出奇地成功,而且让人看得很开心。
另外,DeepMind在生成模型领域也取得了进展。就在一年多以前,DeepMind提出了WaveNet,一个用于生成原始音频波形的深度神经网络,它能够产生比现有技术更好、更逼真的语音。当时,该模型只是一个实验室级别的原型,需要消耗非常高的计算资源,所以无法用于消费级产品。
而在过去的12个月中,DeepMind 和谷歌的团队成功地创建了一个速度快1000倍的新模型。今年10月份,DeepMind正式宣布这个新的并行WaveNet(Parallel WaveNet)开始在现实世界中落地商用,为 Google Assistant提供逼真的美国英语和日语语音生成。
这是 DeepMind 把 AI 系统变得更容易构建、更容易训练、更容易优化的努力成果之一。DeepMind在过去的一年里研究的其他技术,还包括分布概率分布强化学习、基于群落的神经网络训练方法以及新的神经网络架构搜索方法,这都保证AI系统变得更容易构建、预测更准确,优化起来更迅速。
DeepMind 还投入了大量的时间创造新的、有挑战性的环境用来测试他们开发出的 AI 系统,其中就包含了和暴雪合作,把星际2游戏开放成为研究平台。
社会责任
但我们也知道技术不是价值中立的。我们不能简单地在基础研究方面取得进展,我们知道自己同样需要为研究成果的伦理和社会影响承担责任。
这也推动了DeepMind在诸如可解释性等关键领域的研究工作,探索各种各样的新方法来理解和解释我们的AI系统是如何工作的。基于同样的理由,DeepMind成立了一支技术安全研究小组,我们会持续开发切实可行的方法,以确保未来的 AI 系统是可信赖可依靠的,以及它们不会脱离人类的控制。
△我们现在已经与四家NHS信托基金合作
10月的时候,DeepMind又迈出了新的一步,成立了DeepMind Ethics & Society(DeepMind伦理&社会)研究小组,这个团队将帮助DeepMind探索和理解AI在现实世界中的影响,以便让 AI真正地在社会中发挥益处。这项研究将由这个领域著名的专家们指导,比如哲学家尼克?博斯特罗姆(NickBostrom)、气候变化专家克里斯蒂娜?菲格雷斯(Christiana Figueres)、首席研究员詹姆斯?马尼卡(JamesManyika)、经济学家黛安?科伊尔(Diane Coyle)和杰弗里?萨克斯(Jeffrey Sachs)。
AI 必须被整个社会的重点需求和担忧重新塑造,所以 DeepMind和一些合作伙伴共同举办活动,旨在就如何设计和部署人工智能展开全社会的讨论和对话。例如,负责算法正义联盟(Algorithmic JusticeLeague)的负责人Joy Buolamwini 、Article 36和人权观察组织(Human RightsWatch)的专家,以及英国军方都参加了一个连线直播上的活动,讨论算法的偏见性以及限制自动杀伤性武器的使用。正如DeepMind今年反复说起的那样,这些议题太重要了,影响范围太大,不容忽视。
所以,DeepMind 需要开拓新的空间来探讨如何参与以及引导科学技术对世界的影响,不管是在 AI公司之间还是之外。其中一个例子就是“AI 合作伙伴” (Partnership on AI),DeepMind今年在这个组织担任联合主席,而它的目的就是把业界的竞争者们、学术机构和现代社会三者联合起来,共同讨论关键的伦理问题。在过去的一年里,“AI合作伙伴”迎来了43位新的非营利性和营利性的成员,以及一位新的执行董事TerahLyons。在接下来的几个月里,DeepMind期待着与这个团队一起验证各种各样的研究主题,包括算法中的偏见和歧视,机器学习对自动化和劳动力的影响,等等。
DeepMind 同样看重如何利用科学技术来实现社会效益的重要性,也持续地发现着 AI在医疗和能源方面给现实世界带来巨大影响的潜力。今年,DeepMind 和 NHS 医院信托签订了两项合作伙伴协定让 DeepMind 的Streams app 落地应用,该应用支持NHS临床医生使用数字技术,帮助 NHS 医院的医生们做出诊断。DeepMind顶级研究机构的合作组织中的一员,今年他们也发起了一项开创性的研究,要确定最新的机器学习技术是否真的能够帮助提升乳腺癌的检测精度。
同时,DeepMind 也把许多精力投入了自己在保健方面的研究的监管上。DeepMind 也曾经撰文介绍,政府信息专员在 DeepMind与皇家自由医院的合作中有一些发现,以及 DeepMind 保健的独立评审员首次对 DeepMind 的工作发布了公开年度报告,DeepMind也从其中获得了经验教训。他们的仔细监督提高了 DeepMind 的工作质量。DeepMind随之大幅增加了自己和病人以及公众之间的互动活动,包括与病人和看护人员的 workshop;而且 DeepMind也在开发新的技术手段来把信任机制构建到系统中来,比如可验证的数据监督机制(verifiable data audit),DeepMind未来也计划把它作为一个开源工具公开发布出来。
我们为我们在2017年取得的进步感到自豪,但我们知道还有很长的路要走。
在击败柯洁、让 AlphaGo 从竞技比赛退役之后的5个月后,我们在《Nature》上发布了第四篇论文,介绍了 AlphaGo系列的新版本―― AlphaGoZero,它学习围棋技能不需要任何人类的知识。在上百万局游戏中,这个系统逐渐学会了从零开始的游戏,在短短几天内积累了数千年的知识。在此过程中,它还发现了非传统的策略,并揭示了这个古老游戏的新知识。
我们相信 AI 在更复杂的问题上也能起到同样的作用,它可以是科学技术工具,也可以是人类创造力的倍增器。AlphaGo团队已经在着手处理下一组重大挑战,我们自己也希望这些研究人员们感受到了算法灵感的时刻才是刚刚开始。
原文链接:
https://deepmind.com/blog/2017-deepminds-year-review/