AlphaGo 代码开源了,很快你也可以挑战它了
如果你对 AlphaGo 感兴趣,也想自己动手试试,那么下面是个好消息:根据 Engadget 的报道,Google 宣布将 DeepMind 源代码开源,上传到 Github 上。Google 希望以此增加 AI 能力的开放性,让更多开发者参与 AI 研究,观察其他开发者是否能够挑战并打破 DeepMind 现在的纪录。
(图片来自 DeepMind 官网 )
实际上,AlphaGo 如今的水平已经几乎打遍天下无敌手了。
昨天,2016 年三星杯世界围棋大赛决赛中,中国棋手柯洁总比分 2:1 逆转卫冕。赛后, 据新华社采访 ,柯洁坦言自己“现在的状态还不能打败‘AlphaGo’,今后需要更加努力。”
AlphaGo 的战绩确实足够耀眼,让这位史上最年轻的三星杯冠军不想直缨其锋芒:
- 2015 年 10 月,它成为第一个无需让子,即可在 19 路棋盘上击败围棋职业棋士的电脑围棋程序;
- 2016 年 3 月,它以 4:1 的比分击败顶尖职业棋手李世乭,成为第一个不借助让子即可击败围棋职业九段棋士的电脑围棋程序;
- 2016 年 7 月 18 日,根据积分,Go Ratings 网站将 AlphaGo 列为世界围棋排名第一,至此,人工狭窄智能又攻下了一片领地。
近 20 年的发展,围棋人工智能从传统人工智能方法,如使用暴力搜索法(穷举法)、Alpha-beta 剪枝(评估后一个策略是否比前一个策略差,差则停止计算该策略后续发展)等,进化到使用蒙地卡罗树状搜索。蒙地卡罗树状搜索分为三部分:
- 走棋网络:给定当前局面,预测/采样下一步的走棋
- 快速走子:适当牺牲走棋质量的条件下,速度提升 1000 倍
- 估值网络:给定当前局面,估计是白胜还是黑胜
这样,既可以结合树状图的长远推断,又可以像人类大脑自发学习进行训练。
通过学习超过 1 亿盘机器棋局和 80 万人类棋局,单机版 AlphaGo 已经能将已有的围棋人工智能甩在身后,而分布式版本的 AlphaGo 则更是在对战其他围棋人工智能的 500 场比赛中获得全胜。
除了实力惊人的 AlphaGo,Elon Musk 的 OpenAI 旗下电脑训练场 “ Universe ” 也开放成为开源资源。
当然,虽然谈及开源,两家公司都表示希望一直保持 AI 代码的开放性,但实际上,这也是一个略带无奈的举措。正如 Engadget 对此的评价 ,两家公司发展至今,最稀缺的加速推进人工智能开发的东西就是海量数据,这也是为什么两个公司会选择开源了这部分的代码。