DeepMind用深度强化学习研究“人造太阳”!据说这是秘密进行了3年的工作
作者 | 王晔
编辑 | 陈彩娴
北京时间凌晨四点,DeepMind在官方推特上发布消息,称其与瑞士洛桑联邦理工学院(EPFL)合作研究出 第一个可以在托卡马克(Tokamak)装置内保持核聚变等离子体稳定的深度强化学习系统,为推进核聚变研究开辟了新途径, 工作已发表在Nature!
消息一出,立刻引起围观,收获一千多点赞、数百转发:
据该工作的其中一位成员@317070披露, 该工作已经秘密进行了三年, 并兴冲冲地表示:“它真的成功了!深度强化学习真的很擅长搞定这些人类迫切想实现的科幻想法。”
我们都知道,DeepMind是全球最早将人工智能应用于科学研究(即“AI for Science”)的研究机构之一,在过去的几年也取得了许多令人瞩目的成就,成功地在生物、化学、数学与物理模拟等等领域扎下了AI的影子,并吸引一大批学者投身“AI for Science”方向的研究工作。
此前,在DeepMind兼职担任高级研究科学家的华人学者 王梦迪 便曾对AI科技评论谈到,DeepMind有强大的信心将人工智能用于推动人类文明的进步,这种自信也感染了许多年轻的科学家:
DeepMind的价值观就是要推动人类文明的进步。我感觉研究人工智能的学者都非常自信,觉得自己有能力解决世界上最难的问题。这种自信非常棒,会给予自己主观能动性,也会感染其他学者,帮助不同学科的人更快、更好地联合在一起,去解决原先以为难于登天的问题。
而近日DeepMind在难度更高的核物理发布突破成果,无疑更加证明、巩固了其在“AI for Science”方向的领头羊地位!
更有意思的是,AI科技评论编辑组还发现,早在五年前(2017年),就有中国网友在知乎上提出将深度强化学习系统用于学习可控核聚变装置建造技术的设想。莫非 DeepMind 的科研是跟着知乎走的……(手动狗头)
言归正传,我们来看看DeepMind这次又搞出了什么花样!
1
什么是托卡马克装置?
首先,为了更好地了解DeepMind此次的突破,以及“AI+核聚变”的奥妙,我们需要知道: 什么是托卡马克(Tokamak)装置?
此前,知乎上还有一个关于托卡马克的讨论:“刘慈欣在《三体》中为什么不待见托卡马克装置?(托卡马克装置有什么弊端)”:
链接:https://www.zhihu.com/question/31056640/answer/56816872
当时就有网友@Shigen Chin回答:
言归正传:
托卡马克,又称“环磁机”,俄语原文“Токамак”,是一种利用磁约束来实现磁约束聚变的环形容器,最早由位于苏联莫斯科库尔恰托夫研究所(NRC KI)的物理学家伊戈尔·塔姆、安德烈·萨哈罗夫和列夫·阿齐莫维齐等人在1950年代发明。
根据百度百科的描述,托卡马克的中央是一个环形的真空室,外面缠绕着线圈(如下面动图)。通电时,托卡马克的内部会产生巨大的螺旋型磁场,将其中的等离子体加热到很高的温度,以达到核聚变的目的:
2
AI+可控核聚变的前世
-
托卡马克装置在目前的约束技术条件下,难以小型化 -
装置造价,以及氘消耗、等离子体加温等其它方面运行的成本,使实验装置的数量、运行次数均受限,难以支持盲目的反复运行 -
实验涉及高温等离子体,目前约束技术条件下重复反复运行有安全性问题 -
缺乏获取大样本的条件
-
Barana O, Manduchi G, Serri A, et al. A neural network approach for the detection of the locking position in RFX [C]// Fusion Engineering, 1999. Symposium on. IEEE, 1999:575-578.
-
Olofsson K E J. Nonaxisymmetric experimental modal analysis and control of resistive wall MHD in RFPs : System identification and feedback control for the reversed-field pinch [J]. Fusion Plasma Physics, 2012.
3
DeepMind如何做?
雷峰网
(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见。