像FIFA一样踢球的AI,比打游戏更强吗?
图片来源@视觉中国
文 | 脑极体
还记得被阿尔法狗支配的恐惧吗?最新的“AI恐怖故事”,是谷歌教AI踢足球,打造“AI版贝克汉姆”。
其实,这个足球人工智慧研究专案Google Research Football,早在今年6月就出现在了谷歌报告上,而更早一些时间,就在Github上以开源的形式发布了足球环境游戏的测试版代码。
以谷歌“AI界顶流”的咖位,加上当今的资讯效率,现在才突然一波走红,反射弧委实有点过长了。难道是媒体们集体不蹭热点,改成冷饭热炒了?
答案或许处在“下一代AI”这个充满遐想的泛滥标题里,用一个上古时期的互联网话术来说,就是听起来很性感。
此前在《星际争霸》《DOTA2》里超越人类电竞队伍的AI,都没能获此殊荣,踢个足球就引领未来,AI和AI的差别咋就这么大呢?
这一代AI的上升空间还有多大?
大众已经越来越明白,AI不能变魔术了。然而将时间倒回到2016年,相信绝大部分人都不会否认,担心工作被AI替代,被机器人网红索菲亚吓得瑟瑟发抖,觉得《终结者》《黑客帝国》《西部世界》早晚要来,都是切身体会过的心路历程。
传统的“AI恐怖故事”宣告破产,一方面得益于各路技术大牛日积月累地科(怼)普(人),同时也跟建立在深度学习基础上的技术上限有关。
比如建立在庞大的数据运算基础上,训练AI玩电子游戏往往就需要花费数十万美元;比如黑箱性,没有一个深度学习结构(卷积、RNN、LSTM、GAN 等)可以解释自己的决策,暗搓搓地搞歧视、骂人、发明新语种之类的事情层出不穷;再比如只会做“填空题”,面对需要引用常识、共识、推理等问题的时候就会表现的像个智障,容易被糊弄,比如将打印的人脸识别成真的,要么就是智商不及预期,医疗诊断、机器人、自动驾驶等始终进展缓慢……一贯反骨的马斯克,前不久就推出了基于计算机视觉感知的无人驾驶新方案。
总体来说,深度学习真正能成功做到的,还是在给定大量人为标注数据的情况下,实现两个空间事物之间的映射。距离人们预想中的AGI强人工智能真是“事倍功半”,极其遥远。
所以,著名的“唱衰AI”专家 Filip Piekniewski声称将“AI寒冬”的锅甩给了深度学习,虽然有些耸人听闻,也未尝不是指出了一个切实而严峻的问题——如果以深度学习为基础的AI应用不再继续提升,那么相关产业走到“穷途末路”(尤其是那些to VC项目),也是早晚的事~
DL不是终极算法,不妨继续沉迷游戏
既然都这样了,那还怎么做AI?理论上有两个角度:一是深度学习的自我进化,在原有的基础上引入新技术弥补一些先天不足;另一个则是寻找“备胎”,扶持AI领域的其他流派上位。
目前看来,科技企业也确实都极其渴盼变量出现,不过他们更青睐于做温和的“改良派”,毕竟“彻底推翻腐朽政权”还需要一个漫长的培养接班人的过程。
以谷歌Football Engine为例,就让智能体借助奖励机制来自己get动态策略,从而学会规则与踢球技能(强化学习)。
不过,要称之为“下一代AI”未免有点拔苗助长。
首先,“可玩性足球”(Gameplay Football)并没有完全摆脱深度学习的窠臼。系统根据对手的实力不同,提出了简单、终极、困难这三个版本的基准问题,其中简单级别的比赛应用单一机器算法,而困难级别则是由分布式深度学习算法来处理的。
而且,系统所采用的训练方式(即强化学习),与OpenAI Five在游戏Dota 2中击败了世界级电子竞技队OG,deepmind在《魔兽争霸》人机对战中获胜时所采用的训练方式,并没有本质上的区别,都是让智能体在复杂的即时战略游戏中学会与环境交互,并解决复杂的任务。
同时,作为机器学习的一个分支,强化学习之于AGI依然遥远。深度学习三巨头的Yann LeCun 和Hinton都认为,当前用来实现“人工智能效果”的技术,对实现(真正的)人工智能是行不通的。就像怎么优化马车的核心技术,也无法造出汽车一样。
更何况,类似的弥补深度学习不足的机器学习方法还有很多。
比如小样本学习、无监督学习就摆脱了对大规模数据集和人类专家监督的需求,提升自主训练效率;元学习解决了深度学习训练出的智能体技能单一、缺乏常识的问题。深度学习大神Hinton在2015年还提出了一个黑科技——知识蒸馏(Knowledge Distillation),通过迁移知识,借助训练好的大模型得到更加适合推理的小模型,从而提升深度学习在大规模计算集群上的训练表现。
总而言之,所谓的“下一代AI”,核心还是弥补深度学习在理解能力、多模态仿生、应用性价比等方面的不足。作为过渡型方案,这种“深度学习+”估计还会持续很长时间。不过距离真正实现AGI的预期,依然相去甚远。
追寻下一代AI,或许要走向更宽广的技术海域
今日我们看到的大多数AI产品思路,都是以DL(Deep Learning) + GOFAI (Good Old Fashioned AI) 的模式建立起来的。也就是将深度学习与其他算法相结合,让“AI”走向千行万业。
不过也有不少科学家是彻底的“革命派”,想了不少帮助AI的新办法,其中或许也隐藏着破局的可行性。
比如Hinton就试图通过胶囊网络Capsule Networks来颠覆传统的深度学习算法,用神经元向量代替传统神经网络的单个神经元节点,让不同的神经元携带不同属性的信息传导到下一层运算,已经证明可以像人类的视觉系统一样,自动将学到的知识推广到不同的新场景中,这被认为是未来让AI被赋予常识推理的关键技术。
还有的专家坚持基于逻辑规则的符号系统能够实现AI推理,一些学者和创业公司就正在用Prolog(一种基于符号学的编程语言)开发新工具。理论上可以通过非常少的数据来进行训练,自己处理事实和概念,然后自动生成事实推论。
但总体而言,其他分支的AI流派想要撼动“深度学习2.0”的主流地位,仍然比较困难。除了产业端正在大举投入对深度学习及衍生技术的应用之外,美国国防高级研究计划局DARPA甚至筹备了一个名为“机器常识(Machine Common Sense)”的计划,旨在推进和分享模拟人类常识性推理的技术创意,总投资预计约为6000万美元。
作为标杆的深度学习及延伸技术,其商业化潜力,即使“靠山吃山”,也有数年的好光景可以期待。但必须承认,面对其自身的瓶颈,大众的肾上腺素与技术期待也开始回归正常值,甚至有点审美疲劳。技术专家们再不搞个大事件,热爱“AI鬼故事”的科技编辑们都要被逼秃头了……
值得探索的下一代产业AI方向会在哪里,恐怕与我们的现有认知都相去甚远。毕竟世界上每一次巨大的变革,总是开始于某一些被忽视的技术角落。除了继续挑战技术的穹顶,谷歌们似乎别无选择。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App