AlphaZero 靠自己精通三种棋类游戏
2018年12月07日 20时01分
Google AI 子公司 DeepMind 的研究人员去年宣布他们的 AI 程序进化到了 AlphaZero,利用自对弈强化学习在短时间内打败了顶尖的国际象棋和日本将棋程序。在只知道基本规则的情况下,AlphaZero 靠自对弈精通了围棋、国际象棋和日本将棋。本周,DeepMind 在《科学》期刊上发表了他们的通用强化学习算法论文(预印本PDF),确认和更新了去年的结果。论文描述了 AlphaZero 如何快速的学习三种棋类游戏成为史上最强的棋手,尽管它只知道基本规则没有其它该领域的知识。