在 AI 战胜电竞选手后,美国开始提取脑电波训练军事机器人
来源:爱范儿 作者:李浩然
如同前阵子美军使用无人机对伊朗的斩首行动证明现代战争即将进入无人时代一样。美国在军事技术和思想上,一直都走在世界的最前沿。
日前,被称为 互联网 发源地的美国 DARPA (国防高级研究计划局)已经开始了关于 AI 在军事决策领域的研究。
▲ 布法罗大学研究现场 图片来自:digitaltrends
用策略 游戏 培训 AI
通过外媒的报道,我们得知来自纽约布法罗大学人工智能学院的工程师已经获得了 DARPA 的资助。他们通过创造一个类似星际争霸或者 Stellaris (群星)的游戏,并采集玩家在其中的大脑活动和反应,并用这些数据训练 AI 。
▲ Deep Mind 决策过程
与 Alpha Go 下围棋不同,类似星际争霸的 RTS 游戏在策略和操作的复杂度上要更高,这类游戏需要玩家协调采集资源、建造建筑、选择进攻策略,甚至还要操控每一个士兵的进行精细运动,而且这一切都是在拥有「战争迷雾」,也就是不完全信息的条件下进行的。
▲ 布法罗大学 图片来自:digitaltrends
很显然,此类游戏比起简单的棋类策略,与真实的战场环境更加接近。在这种信息不对称的环境中训练出来的 AI ,更容易在信息错综复杂的战场中做出合理的判断。
监测脑波,向 AI 展示人类决策过程
可能有人要问,这和之前 Google 团队针对星际争霸 2 开发的 Deep Mind 有什么区别。与 Deep Mind 目的是获得胜利不同。DARPA 想观察人类在类似场景中的判断和决策,并用机器学习算法进行梳理,训练出可以相互协调的机器人。
▲ Deep Mind 眼中的游戏
为了达成这个目的,DARPA 要求所有在布法罗大学玩的新策略游戏的玩家佩戴检测脑电图( EEG )的头盔。在观察玩家在游戏中策略操作的同时,研究者可以对照脑电图,观察玩家在策略选择时的大脑活动。
与此同时,研究人员还配置了特殊的超高速摄像头用来追踪玩家的眼球运动。配合游戏画面,观察人类在决策时的直觉反应。
为什么 DARPA 要做这样的研究?
对于 DARPA 来说,他们并不想要一个只会执行任务的机器人,他们需要一群机器人互相配合,自己根据当前掌握的信息进行规划,并有策略的完成任务。
▲ DAPRA 想要组建空天一体的作战能力 图片来自:知乎
如果在策略执行中遇到阻碍,也能适时改变策略。比如说在高度复杂的环境中(天气、地理环境、敌我动态)开展多达 250 个单位(空中与地面机器人)的任务协作。这时突然出现烟雾导致可见性丧失,AI 控制的机器人同样能改变策略,继续完成任务。
▲ 未来的无人机蜂群作战
只有达到了这样的水平,AI 在军事领域的应用才能排上用处。
但从目前来看,当前的 AI 都是在相对确定的环境下训练的,但真实环境往往是复杂而信息缺乏的。在这种环境中决策,AI 需要根据已知的信息进行推理。目前,AI 在这方面还处于新生状态。
▲ 美军微型无人机「蜂群」演示 图片来自:美国国防部视频截图
这个研究的意义就是让人类成为老师,在游戏中向 AI 展现人类长期演化而来的直觉,并通过监测脑电波,向 AI 展示人类如何对接受的信息进行处理,从而让 AI 产生上下文推理的能力,并最终学会总体策略的制定。
▲ 完成任务后「蜂群」绕圈飞行 图片来自:美国国防部视频截图
我们知道,人类之所以在进化路上生存下来,就是因为人类不仅有个体决策,还有指导人类完成任务的总体策略。所以如果想要 AI 完成人类的工作,指导 AI 相互配合并制定总体决策就势在必行。
结语
过去,机器是辅助人类工作的工具,必须由人来操控。
后来,人类为工具编好了执行流程,让工具可以按照流程自动工作。
现在,机器通过机器学习和神经网络算法,能够执行简单的判断和决策任务。
未来,人类将赋予机器群体策略能力,人类下达任务不再需要给每个机器具体任务,我们只需要给定一个目标,AI 将会制定整体策略,并将任务分配给每一台由独立 AI 控制的机器,通过协作完成任务。
从总体来看,这是人类的一大技术进步。只是从历史角度看,这种技术通常都会先用在军事行动中。
还是那句老话:技术不分善恶,只在用途。 如果这种技术成为现实,希望它永远不要用于战争。