谷歌DeepMind AI已经掌握超难雅达利游戏

网易科技 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

（原标题：谷歌DeepMind AI已经掌握超难雅达利游戏）

与李世石一战成名后，AlphaGo背后的谷歌DeepMind人工智能团队越来越受到业界关注。DeepMind团队的领导人Demis Hassabis与游戏界的渊源由来已久，在AlphaGo成名之前DeepMind团队最初用来测试AI的都是雅达利的老游戏。

最早DeepMind的老版本AI在超难的游戏《Montezuma’s revenge》中表现欠佳，但是在经过长时间的学习和试错后，DeepMind团队新版本的AI真正地掌握了游戏大师级技巧。其学习过程并无采取任何捷径，没有被提供额外的信息。真正地模仿人类学习过程，DeepMind的人工智能已经学会了躲避技巧，拾取钥匙，像专家一样努力争取最高分。

DeepMind在新版本的AI中加入了一种名为“好奇心”的内部激励机制，游戏AI能够更趋向于获得更高分，并积极探索更多不同的游戏方法获得更好的回报。这项机制能够允许新版本的AI更加积极地去探索游戏要素，掌握游戏方法。

从以下对比可以看出来，老版本AI仅探索了2间游戏房屋，新版本AI则由新机制驱动探索了共15间游戏房屋。

谷歌DeepMind AI已经掌握超难雅达利游戏