【钛晨报】 DeepMind 的 AlphaStar 横空出世,《星际争霸2》人类1:10输给AI

钛媒体  •  扫码分享

【钛晨报】 DeepMind 的 AlphaStar 横空出世,《星际争霸2》人类1:10输给AI

图片来源:视觉中国

钛媒体综合】北京时间1月25日,DeepMind 的AI AlphaStar 首次亮相。DeepMind 在凌晨2:00起公布了其录制的 AI 在《星际争霸 2》中与2位职业选手的比赛过程:AlphaStar 分别以5:0的成绩战胜了两位职业选手 TLO 和 MaNa 。

科技媒体DeepTech深科技介绍,AlphaStar 与两位职业选手的两次比赛相隔了约两周,可以看到经历了从与 TLO 对战时的菜鸟级别,AlphaStar 进化到完美操作的过程,尤其是与 MaNa 的对战,已经初步显示了可以超越人类极限的能力。由于时间限制,演示中并没有播放所有比赛,而是在展示了另外一局比赛录像后,给出了 TLO 五局全败的战绩。不过所有的录像都将在 DeepMind 官网上放出,供人下载。

除了此次比赛录像,AlphaStar 还和职业选手 MaNa 在现场来了一局比赛,但以1:0的成绩输给了人类选手MaNa 。而且,虽然两位职业选手以全败告终,宣告了 AlphaStar 的实力已经不可同日而语,但现场表演赛充分暴露了 AlphaStar 目前的不足。

我们不难看出,尽管其神经网络已经趋于长期优化,但似乎仍然会在一定程度上陷入局部最优,被人类发现固定模式,落入圈套。

比赛回放过程中,主持人问到 DeepMind 科学家,平时如何训练 AlphaStar。DeepMind 科学家 Oriol Vinyals、David Silver 表示,首先是模仿学习,团队从许多选手那里获得了很多比赛回放资料,并试图让 AI 通过观察一个人所处的环境,尽可能地模仿某个特定的动作,从而理解星际争霸的基本知识。这其中所使用到的训练资料不但包括专业选手,也包括业余选手。这是 AlphaStar 成型的第一步。

之后,团队会使用一个称为“Alpha League”的方法。在这个方法中,Alpha League 的第一个竞争对手就是从人类数据中训练出来的神经网络,然后进行一次又一次的迭代,产生新的 agent 和分支,用以壮大“Alpha League”。


【钛晨报】 DeepMind 的 AlphaStar 横空出世,《星际争霸2》人类1:10输给AI

Alpha League 示意图(图源:Youtube)

然后,这些 agent 通过强化学习过程与“Alpha League”中的其他竞争对手进行比赛,以便尽可能有效地击败所有这些不同的策略,此外,还可以通过调整它们的个人学习目标来鼓励竞争对手朝着特定方式演进,比如说旨在获得特定的奖励。

最后,团队在“Alpha League”中选择了最不容易被利用的 agent,称之为“the nash of League”。

钛媒摘声:

不要惧怕新的变化,不要对年轻人说不。他们可以提出一些你从来没听过的想法。我们也生活在互联网上,可以享受他们的生活方式。如果我有时间,我就会刷直播。要对世界充满好奇心,并从中找到乐趣。

——阿里巴巴CEO 张勇

中国、美国成为人工智能的领跑者,在人工智能技术浪潮发展中,需要确保各个国家都从中获益,而不是由美国或欧美发展的人工智能的原则,需要抱有求同存异的心态。

——创新工场创始人兼CEO 李开复

更多关注:

英特尔第四季度营收187亿美元,同比扭亏

北京时间1月25日凌晨消息,英特尔今天公布了2018财年第四季度及全年财报。报告显示,英特尔第四季度营收为186.57亿美元,与上年同期的170.53亿美元相比增长9%;净利润为51.95亿美元,相比之下上年同期的净亏损为6.87亿美元。英特尔第四季度调整后每股收益超出华尔街分析师预期,但第四季度营收以及2019财年第一季度和全年业绩展望均未达预期,导致其盘后股价大跌逾6%。

柔宇副总裁炮轰小米:折叠屏是公然造假,价值观很Low

钛媒体1月24日消息,柔宇科技副总裁樊俊超在朋友圈炮轰小米,称小米双折叠手机是买的别人尚未量产的概念柔性屏幕和概念机,小米宣称的“攻克了柔性折叠屏技术”是公然造假。

樊俊超直言,小米是一家没有核心技术的手机组装公司,如今买个别人尚未量产的概念柔性屏幕和概念机就说自己"攻克了柔性折叠屏技术,“难怪业界那么多人瞧不起他们,因为这种很low的价值观不值得尊重!”

抖音再度回应微信无法登录:多次与腾讯沟通均无回复

钛媒体1月24日消息,对新用户无法用微信授权的方式登录抖音的问题,抖音今日进一步表示,这种做法给抖音和微信的共同用户造成困扰,抖音多次与腾讯沟通,均没有得到回复。抖音称,希望企业之间不要脱离正常的市场竞争范畴,不要给封杀找借口,更不要在封杀的同时,还污名化被封杀者。

针对“微信关系链可以被轻松复制到抖音平台”的消息,抖音短视频发布回应称,除非微信主动提供,没有任何一个第三方应用可以通过微信账户登录的方式,获取微信关系链。截至目前,微信并未发生关系链大规模泄露事件。

微软收购开源公司Citus Data,加码对抗谷歌、亚马逊

北京时间1月25日凌晨消息,据美国媒体CNBC报道,微软周四表示,它正在收购一家初创公司Citus Data。该公司已将其称为PostgreSQL的开源数据库软件商业化。交易条款尚未披露。

这笔交易可以支撑微软提出支持开源技术的论点,特别是在云端。微软一直继续从受欢迎的自有产权软件如Windows和Office赚钱。在云计算业务方面,微软希望利用开放性来应对谷歌、市场领导者亚马逊等公司的竞争。

科创板首批试点企业的选择以券商报送为主

钛媒体1月24日消息,随着深改委审议通过两份意见,科创板及注册制的相关细则料将在不久之后出炉。据记者了解首批试点企业的选择以券商报送为主。一家头部券商投行部人士表示,上报工作很早就已经完成,首批试点企业的标准仍然不低,如市场传言一样,公司必须具备硬科技的特点。此外,有业内人士指出,第一批企业范围大概率集中在北上深等一线城市。

锤子员工自述:被变相强制离职,罗永浩一直活在梦里

钛媒体1月24日消息,近日,对锤子科技员工转签字节跳动合同的消息,字节跳动方面回应称,只是收购了锤子科技部分专利使用权。某锤子员工自述称,已转签合同,工作岗位和内容仍未知,期间锤子科技和字节跳动都没有管理层出面安抚这批员工。不签面临的结果很可能是公司没钱,工资都无法保障。他认为,罗永浩“是个活在梦里的人,太理想主义”, 对财务和盈利关注甚少。

苹果裁撤自动驾驶项目逾200人

钛媒体1月24日消息,据CNBC,苹果裁撤自动驾驶项目逾200人。曾从苹果跳槽到特斯拉负责监督Model 3生产的高管道格·菲尔德(Doug Field)在今年8月又回到了苹果,参与管理研发汽车的“泰坦”计划团队(Project Titan)。此轮裁撤被视为新领导层下的一次重组。按照苹果发言人的说法,被裁撤的团队会以其他方式支持公司的机器学习项目。

国务院:加大对雄安新区直接融资支持力度

钛媒体1月24日消息,加大对雄安新区直接融资支持力度,建立长期稳定的建设资金筹措机制。加大对地方政府债券发行的支持力度,单独核定雄安新区债券额度,支持发行10年期及以上的雄安新区建设一般债和专项债。支持中国雄安集团有限公司提高市场化融资能力,规范运用社会化、市场化方式筹资,严禁金融机构违规向雄安新区提供融资。

优先支持符合条件的雄安新区企业发行上市、并购重组、股权转让、债券发行、资产证券化。支持在雄安新区探索推广知识产权证券化等新型金融产品。鼓励保险公司根据需要创新开发保险产品,推进京津冀地区的保险公司跨区域经营备案管理试点。

LG智能手机业务巨亏25亿美元,仍不想放弃

钛媒体1月24日消息,据外媒报道,在过去三年里,LG电子的智能手机业务亏损了约2.8万亿韩元(合25亿美元),严重侵蚀了该公司最赚钱的家用电器和电视机业务的利润。但是,该公司并不准备放弃智能手机业务。LG电视部门负责人权邦锡被认为是推动了高端电视机销售的功臣。今年1月,他开始了他的新任务:让智能手机业务扭亏为盈。 

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App


随意打赏

谷歌收购deepminddeepmind公司deepmind星际谷歌deepminddeepmind团队deepmind《横空出世》ai是什么横空出世
提交建议
微信扫一扫,分享给好友吧。