雷锋网 AI科技评论按,北京时间10月19日凌晨,DeepMind在Nature上发布论文《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋),在这篇论文中,DeepMind展示了他们更强大的新版本围棋程序“AlphaGo Zero”,掀起了人们
雷锋网 AI科技评论按,北京时间10月19日凌晨,DeepMind在Nature上发布论文《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋),在这篇论文中,DeepMind展示了他们更强大的新版本围棋程序“AlphaGo Zero”,掀起了人们
作者:周熠前言AlphaGo Zero [1]提出了新的估算搜索评价函数的方法,即基于蒙特卡洛树搜索的强化学习;部分地解决了超大状态空间搜索的难点;成功地应用到围棋领域并完胜了人类;证明了强化学习的有效性,是人工智能史上一座里程碑。其学术贡献中上,学术意义上,社会影响上上。AlphaGo Zero虽然不是开创性工作,但