谷歌DeepMind AI已经掌握超难雅达利游戏
(原标题:谷歌DeepMind AI已经掌握超难雅达利游戏)
与李世石一战成名后,AlphaGo背后的谷歌DeepMind人工智能团队越来越受到业界关注。DeepMind团队的领导人Demis Hassabis与游戏界的渊源由来已久,在AlphaGo成名之前DeepMind团队最初用来测试AI的都是雅达利的老游戏。
最早DeepMind的老版本AI在超难的游戏《Montezuma’s revenge》中表现欠佳,但是在经过长时间的学习和试错后,DeepMind团队新版本的AI真正地掌握了游戏大师级技巧。其学习过程并无采取任何捷径,没有被提供额外的信息。真正地模仿人类学习过程,DeepMind的人工智能已经学会了躲避技巧,拾取钥匙,像专家一样努力争取最高分。
DeepMind在新版本的AI中加入了一种名为“好奇心”的内部激励机制,游戏AI能够更趋向于获得更高分,并积极探索更多不同的游戏方法获得更好的回报。这项机制能够允许新版本 的AI更加积极地去探索游戏要素,掌握游戏方法。
从以下对比可以看出来,老版本AI仅探索了2间游戏房屋,新版本AI则由新机制驱动探索了共15间游戏房屋。