年度盘点:2016人工智能领域十大焦点回顾
刚刚过去的2016年,这个世界发生了很多大事:从越搅越乱的中东乱局到出人意料的英国退欧、再从戏剧性十足的美国大选到毫无疑问的中国继续崛起……这个世界似乎正在发生着什么翻天覆地的变化。不管这些变化是否符合我们的期待,我们都可以确信在这些变化之后,科学技术的持续进步无疑是其中最大的推动力量之一。
在这方面,随着深度学习在最近几年的突然高速崛起,人工智能的发展已经成为了科技发展中一股不可忽视的巨大力量,甚至有许多学术界和产业界的专业人士将其看作是未来技术进步的最底层的技术革命之一。粗略估计,在可预见的时间内,人工智能将带来颠覆性影响的领域将包括但不仅限于:翻译、广告、通信、运输、图像……甚至有些眼光长远的「预言家」还认为人工智能不仅将改变我们的生活方式,还将改变我们对人类、智能乃至宇宙的本质的理解。
和这个世界一样,过去的一年的人工智能也发现了很多重大的事件。现在就让我们站在新一年的起点回顾一下过去这人工智能高速发展的一年:人工智能成长为了游戏高手、围棋大师、语音转录专家、司机、翻译家、图像艺术家、鉴黄师、武器……我们对2016年的人工智能领域内的事件进行了盘点,从中选取了我们心中的十大最具里程碑意义和最引人关注的焦点事件。
No.1人机世纪大战:李世石vs. AlphaGo
里程碑意义:★★★★★
社会关注度:★★★★★
2016年3月,人类在棋盘游戏上的最后一块保留地被机器攻陷:世界围棋大师在韩国首尔以1:4的成绩不敌Google DeepMind开发的人工智能程序AlphaGo,引起了世界各地人民的广泛关注和热议。赛后韩国棋院授予AlphaGo荣誉九段的段位,赛后不久AlphaGo的世界排名 (https://www.goratings.org/) 就升至了第二。到7月17日,原本世界排名第一的围棋大师柯洁由于在海峡两岸世界冠军争霸赛中表现不佳,积分下跌,AlphaGo反超柯洁,排名在世界第一的位置维持了一段时间。
AlphaGo的开发团队是英国人工智能研究公司DeepMind,该公司在2014年被谷歌收购之后迅速成长为了人工智能研究领域的一大重镇。在天才研究者Demis Hassabis的带领下,DeepMind的规模不断扩张,吸引了大量来自世界各地的人工智能人才,也在许多研究领域实现了很多重要的突破。其中包括掌握Atari游戏、语音合成、解读唇语、规划地铁路径、提出重量级的可微神经计算机等等。不仅在研究上,DeepMind也在尝试将其研究成果产品化,7月份的时候,谷歌就表示DeepMind的深度学习技术可以帮助谷歌的服务器节省数亿美元的电费。除此之外,DeepMind和英国国家医疗服务体系(NHS)的合作也堪称人工智能在医疗应用上典范代表。
另外还有值得一提的是,DeepMind在棋盘游戏上「将人类踩在脚下」之后,又看上了更复杂的即时战略游戏。11月份,DeepMind宣布与著名游戏公司暴雪建立了合作关系,要让人工智能在基于人类视角和操作速度的基础上征服经典即时战略游戏《星际争霸》。也许不久之后,我们就会看到DeepMind 实现新的传奇了。
No.2终结马路杀手,无人驾驶汽车纷纷上路
里程碑意义:★★★★★
社会关注度:★★★★★
2016年,除了时不时就霸占头条的谷歌无人驾驶汽车,也有更多的企业和机构开始在无人驾驶技术的研究和应用上崭露头角,这其中既包括谷歌这样的互联网和技术公司百度、Uber 和IBM 等,也有通用和本田等传统的汽车制造商,另外也还有特斯拉这样的新一代汽车公司;当然,MIT 和哈佛大学等学术研究重镇也都或多或少有自己的无人驾驶相关的研究项目(包括无人驾驶技术和背后涉及到的社会学、伦理学和法律学问题)。
2016 年年初,世界首款无人驾驶公交车在荷兰小镇Wageningen 正式上路,这款名为WePod 的电动汽车是由法国机动车制造商 EasyMile 和欧盟运输计划 Citymobil2 设计的,可搭载6 名乘客,不过其运营路线长度只有200 米,时速仅有8 公里。
去年8 月,世界首个无人驾驶出租车 nuTonomy 在新加坡正式开始上路测试,参与乘客可以通过智能手机预约。这家从麻省理工学院分离出来的创业公司专门从事开发无人驾驶出租车。虽然谷歌和沃尔沃等的多家公司早已在马路上进行了自动驾驶测试,但 nuTonomy 却成了第一家向公众开放自动驾驶汽车的公司。到年底时,Alphabet/谷歌旗下的无人驾驶项目也终于修成正果,开始以独立公司 Waymo 的形式运营。
无人驾驶的飞速发展也引发了一些问题。过去的一年,特斯拉汽车报告了好几起与其自动驾驶辅助技术 Autopilot 相关的事故,其中一起事故更是造成了车毁人亡的后果(之后特斯拉还为此发表声明警告驾驶者不要完全依赖现在还并不完美的自动驾驶功能)。尽管有这些挫折,但毫无疑问,无人驾驶在过去的一年中确实得到了很大的发展。按照中国和美国 发布的无人驾驶路线图,如果进展顺利,那么也许在未来不到十年之内我们就能用上完全自动驾驶的汽车了。
No.3 人工智能真的危险吗?持续一整年的人工智能威胁论
里程碑意义:★★★★☆
社会关注度:★★★★★
又过了一年,霍金和马斯克等世界名人的「人工智能威胁」警告继续发酵。尤其是在三月份 AlphaGo 击败了世界围棋大师李世石之后,这些警告也竟开始变得有些说服力了,至少确实有很多人开始认为人工智能存在威胁了。
另外还有一件事也引起了人们极大的关注,2016 年3 月份,微软在 Twitter 平台上推出了一个人工智能聊天机器人 Tay;这个机器人的最初设计目的是模仿一位19 岁美国青少年女性的说话方式,同时它还具有从对话中进行学习的能力。结果上线还不到一天,Tay 就「堕落」成了一个满口纳粹言论的种族主义者。
Tay 的一些不当言论
而此前还有谷歌的图像识别程序将黑人识别成猩猩、给男性和女性推荐有差别的职业广告等等问题和后来发生的美国达拉斯警方用拆弹机器人炸死嫌犯、社交网络上的新闻推荐可能影响了美国大选等等事件。这些问题和事件在媒体的鼓吹下不仅和好莱坞一起进一步渲染了人工智能威胁论,也让一些研究者看到了人工智能可能会具有的不平等乃至威胁(不管是来自有偏见的算法本身还是来自所使用的数据)。但与此同时,这些报道也让研究者看到了公众对人工智能技术的不理解,进而让很多业内的人士和机构看到了向公众科普人工智能的重要性。
在这一系列事件的背景下,很多机构和研究者也做了很多工作,包括 9 月底的时候,谷歌携旗下公司 DeepMind,联合微软、亚马逊、Facebook 和 IBM 成立了名为 Partnership on AI 的组织,以共同探索人工智能技术的安全研发之路和促进公众对人工智能的正确理解。除了这些合作之外,有很多学界、产业界以及喜欢夸大其实的媒体界的人士都针对这一主题写过一些报道,其中有《微软 CEO 的「人工智能法则」:不得伤害人类,必须透明》、《ACM 月刊 | 艾伦人工智能研究所 CEO:设计遵循人类法律和价值观的人工智能系统 》、《Nature:对抗偏见,大数据算法需要更多责任》等等。
人工智能与人类的未来究竟将走向何方不是靠争论就能解决问题的,毕竟实践才是检验真理的唯一标准。对于人工智能相关法律问题和社会影响等议题也已经被提上了许多政府机关的议事日程。但不管我们商讨的结果如何,技术的发展终究是势不可挡的,而且就像美国经济顾问委员会主席 Jason Furman 说的那样:「未来我们需要人工智能」。
No.4 全球政府开始关注人工智能:一边鼓励一边寻求管制方法
里程碑意义:★★★★☆
社会关注度:★★★★★
如果非要给人工智能时代的到来选一个标志,还有什么比世界上最强大的国家的政府对人工智能的关注更合适呢?2016 年 10 月,美国白宫发布了《为未来人工智能做好准备》和《美国国家人工智能研究与发展策略规划》两份重磅报告,详细阐述了美国未来的人工智能发展规划以及人工智能给政府工作带来的挑战与机遇。VentureBeat 对这两份报告进行了总结,得出了 7 个浅显易懂的要点:1. 人工智能应当被用于造福人类、2. 政府应该拥抱人工智能、3. 需要对自动汽车和无人机进行管制、4. 要让所有孩子都跟上技术的发展、5. 使用人工智能补充而非取代人类工作者、6. 消除数据中的偏见或不要使用有偏见的数据、7. 考虑安全和全球影响。
美国总统奥巴马在接受 Wired 专访时谈论了人工智能、自动驾驶汽车和人类的未来
到 12 月份,白宫还跟进发布了一份《人工智能、自动化与经济》的报告,谈到了智能技术和自动化技术对经济的影响和可能的应对策略。
除了美国政府之外,欧洲、中国、日本和新加坡等多个国家和地区的政府也开始将人工智能看作是未来实现国家竞争力的重要战略方向。中国国务院总理李克强就曾多次谈到过政府对人工智能和机器人产业的大力扶持。
而除了对人工智能产业的扶持,相关的管理规范和法律方面的工作也已经被许多政府和研究机构提上了议事日程:如何应对自动化所带来的就业危机、如何公平分配人工智能所创造的经济价值、如何对自动设备所带来的问题进行追责、以及如何防止人工智能技术被恶意利用而造成危害……这些都是重要的议题,而且我们都目前为止都还没有找到这些问题的完备答案。
在 7 月份美国经济顾问委员会提交给总统的一份报告中,该委员会估计大约 83% 时薪低于 20 美元的工作将会被自动化。针对这一问题,该委员会还提出了两个指导决策的基本原则:允许灵活性和实验,而不是强加限制;直接鼓励工作,而不是为其废止做规划。
但不管怎样,这一次以智能和自动化技术为基础的技术变革对所有人(包括所有政府)来说都是全新的。不过其带来的结果如何,政府都应该对目前所发生的一切保持敏锐和预见能力,这样才能以一种健康公正的社会状态迎接这个前所未有的技术变革。
No.5 继续超越人类,微软语音识别技术达到专业转录员水平
里程碑意义:★★★★☆
社会关注度:★★★★☆
如果人类是一个单一的好强的生命体,那么今天对它来说一定不好过,因为人工智能不仅在围棋上让它吃了亏,也更是在其它领域超越了人类。在微软的研究者十月份发表的一篇论文《Achieving Human Parity in Conversational Speech Recognition》中,人工智能与研究部门的一个研究者和工程师团队报告出他们的语音识别系统实现了和专业速录员相当甚至更低的词错率(WER),达到了 5.9%!而就在一个月前,微软才刚实现了历史性的 6.3%。这一成果和实现进展的速度甚至让一些人类转录员感受到了失业的风险。
而几乎就在同一时间,备受关注的锤子科技 CEO 罗永浩在该公司的新品发布会上演示了科大讯飞的语音输入法功能,结果没让任何人失望。
这一技术的日益成熟也为语音助理的普及奠定了发展基础。在 2016 年的 AWS re:invent 大会上,亚马逊就发布了多款可以帮助开发者更轻松地开发其语音助理 Alexa 相关应用的开发工具。据亚马逊 Alexa 部门副总裁 Rohit Prasad 介绍,Alexa 现在已经具备 5000 多种能力(skill)了;而装备了 Alexa 的 Amazon Echo 现在也已经能够帮助用户通过语音完成很多日常任务了,包括日程规划、音乐搜索等等。除了亚马逊之外,谷歌、微软、三星、苹果等公司都有专门的团队在帮助建设他们自家的语音助理平台。也许不久之后,你就再也不用担心没人听你说话了吧,因为机器会一直在身边听见和听懂你的话。
No.6 机器翻译整合神经网络,接二连三实现颠覆性突破
里程碑意义:★★★★☆
社会关注度:★★★★☆
据维基百科介绍,人类目前大概有 6000 多种语言。自人类在未建成的「巴别塔」下不欢而散以来,实现全人类之间的顺畅交流一直是我们的梦想。现在,基于神经网络的人工智能方法已经让我们看到了真正实现这一梦想的希望。
2016 年 9 月份,谷歌在 arXiv 上发布了一篇论文介绍了其神经机器翻译系统(GNMT),「该系统使用了当前最先进的训练技术,能够实现到目前为止机器翻译质量的最大提升。」谷歌的博客还宣布已经将其投入到了汉语-英语之间的机器翻译应用中。之后不到两个月,谷歌又再次发表论文宣布了进一步的突破:实现多种语言之间的神经机器翻译,并且还实现了突破性的 zero-shot 翻译!
GNMT 的模型架构
在 11 月份的乌镇互联网大会上,搜狗 CEO 王小川在演讲过程中同步演示了自家的实时机器翻译应用。尽管这一事件后来引起了很多争议,但毫无疑问这反映了机器翻译技术正变得越来越成熟的趋势。也许几年之后,我们就能在自己的耳朵里面塞入一个人工智能「巴别鱼」,然后就能听懂每一个人所说的话了。
除了语言对之间的文本序列到文本序列的翻译,另外值得一提的一项突破是唇语到语言(视频序列到文本序列)的「翻译」,而且其所实现的超越人类的进展基本上毫无争议的。11 月份,牛津大学、Google DeepMind 和加拿大高等研究院(CIFAR)联合发布了一篇重要论文,介绍了利用机器学习实现的句子层面的自动唇读技术 LipNet,该技术将自动唇读技术的前沿水平推进到了前所未有的高度――实现了 93.4% 的准确度,远远超过了经验丰富的人类唇读者。
No.7 人工智能硬件大战打响,巨头 vs. 创业公司
里程碑意义:★★★☆☆
社会关注度:★★★★☆
随着深度学习算法变得越来越复杂、所使用的数据集变得越来越大,对专用硬件的需求也正变得越来越大。2016 年,面向人工智能的平台成了计算硬件开发的一个主要的新方向。这一年,除了英特尔和英伟达这两家芯片巨头在人工智能方向连绵不断的高调动作,掌握核心科技的创业公司也在尽力改变着市场格局(尽管其中大部分有潜力的都被收购了),此外,就连谷歌这样的互联网也从中看到了发展的空间。
传统芯片厂商方面,英伟达借助 GPU 和深度学习算法的高度契合而顺势发展,股价飞涨,可以说是 2016 年人工智能计算硬件领域的最大赢家。体量更大的巨头英特尔自然也不会等着这个新市场被竞争对手占领,而收购似乎是个更快捷的追赶方法。2016 年,英特尔收购了多家人工智能创业公司,其中包括计算机视觉创业公司 Movidius 和深度学习芯片创业公司 Nervana 等。到 11 月份,有了 Nervana 和 2015 年收购的 FPGA 厂商 Altera 加持的英特尔公布了其人工智能路线图,介绍了该公司在人工智能芯片市场上的公司战略和产品生态系统。另外随便一提,在这一领域存在感差很多的 AMD 在 2016 年年底也终于发力,宣布推出了其首款基于 VEGA GPU 架构的机器学习芯片。另外,DSP 供应商 CEVA、FPGA 供应商 Xilinx 和处理器技术提供商 Imagination 等厂商也都已经在机器学习领域进行了布局。
英伟达 CEO 黄仁勋在 GTC Europe 2016 上演讲
互联网巨头似乎也从计算硬件领域发现了新的机会。2016 年 5 月,谷歌发布了一款新的定制化设计的芯片张量处理单元(TPU/Tensor Processing Unit),这款芯片是专门为基于谷歌已经开源的 TensorFlow 机器学习框架而量身定制的。微软也通过 Project Catapult 表明了对 FPGA 的支持。另外,这一年 IBM 在神经形态计算上的进展也得到了很大的关注,甚至可能预示着一种人工智能发展的新方向。
创业公司方面,除了被收购的 Nervana 等公司,还有 Wave Computing、Kneron 以及中国的寒武纪和深鉴科技等公司都在努力开发自家的深度学习专用芯片平台。而这些创业公司在 2016 年同样也取得了相当不俗的表现,比如源自中科院计算机研究所的寒武纪就在 2016 年推出的寒武纪 1A 处理器,据称这是世界首款商用深度学习专用处理器。
No.8 斯坦福大学发布人工智能研究百年报告
里程碑意义:★★★★☆
社会关注度:★★★☆☆
2014 年秋季,斯坦福大学启动了一个人工智能百年研究项目。两年之后――2016 年 9 月初――斯坦福大学所组织的包含了谷歌和微软等科技巨头、哈佛大学和 MIT 等著名大学以及艾伦人工智能研究所等专门的人工智能研究机构的众多专家学者的委员会终于发布了他们百年项目的第一份报告《2030 年的人工智能与生活(AI and Life in 2030)》,该报告囊括了人工智能最近的发展以及对就业、环境、运输、公共安全、医疗、社区参与和政府的潜在影响。
报告发布后得到了极大的关注,在某种程度上也为近未来的人工智能的发展起到了一定的指导性作用。该报告写道:「「百年研究」定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的关于人工智能及其影响的收集性的和连通的集合。这些研究希望能在人工智能领域的研究、发展以及系统设计方面、以及在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。」
除了斯坦福大学的这份报告,也还有其它许多调研机构和科技媒体也发布了自己的调查或预测报告。在这里当然要安利一下机器之心发布的月度《AI00:全球最值得关注的 100 家人工智能公司》系列报告,该报告按语音和自然语言、计算机视觉、芯片和硬件等十个主题梳理盘点了人工智能领域最值得关注的 100 家公司。该报告将继续保持每月更新的频率,最新版本的报告可点击这里查看。
No.9 人工智能/机器人开始渗透进人们的日常生活
里程碑意义:★★★☆☆
社会关注度:★★★☆☆
尽管现在的人工智能和机器人离科幻作品里面的那些善解人意的、甚至有自我知觉的形象还有很大的差距,但它们已经在成群结队(有时候却悄无声息)地进入我们的日常生活了。
且不必谈那些背后使用了智能和学习算法的模式筛查、搜索引擎、推荐系统和翻译应用等等。在我们能够直观感受智能应用上,我们也能感受到非常直接的进步:过去的一年里,亚马逊 Alexa 变得更加聪明了――具备了近 5000 种技能,而谷歌也在 2016 年 3 月份宣布了对标了亚马逊 Echo 的音箱式语音助理产品 Google Home,此外,微软的小娜和小冰姐妹也在我们的生活场景中变得越来越常见。
软件之下,在我们可以直接触摸的承载和表现智能的硬件(机器人)上,我们也能看到它们大步迈进的身影:自动驾驶汽车开始实验性地载客、快递无人机正在探索货运的新方式、人形机器人在日本的企业里面充当接待员、护理机器人进入了欧洲一些老人和自闭症儿童的生活、更不要说已经在很多家庭里面兢兢业业工作的扫地机器人了……甚至还有一些机器人加入了执法者的队伍――7 月份,美国达拉斯警方在与杀警狙击手对峙几小时后,出动机器人载着炸弹炸死了嫌犯,这被认为是美国警方首次以这样的自动装置来执法。(当然,军用无人机早已经在战场得到了应用。)
当然,除了普通人的日常生活之外,科学家的日常生活里面更是出现了更多人工智能/机器人。2016 年 7 月,NASA 向好奇号火星车推送了一个更新,让其可以在遥远的火星上自己选择需要研究的石头。人工智能甚至还成了科学家寻找外行星甚至外星生命的助手。至于分析粒子数据、大气系统、基因组、经济活动、社会状况等数据的模式,那几乎已经可以算是人工智能的拿手好戏了。另外值得一提的是,12 月初 Science 旗下的机器人主题期刊 Science Robotics 的创刊号正式发布,为机器人领域的繁荣提供了直接的见证。
艺术方面人工智能也没有落后,能够编写古典音乐的智能系统已经出现,Prisma 等艺术风格渲染应用更是风靡一时,人工智能还作为鉴赏家找出了莎士比亚作品的合作者并且甚至还学会了剪辑色情视频,当然也不要忘了人工智能甚至还当了编剧写出了一些剧本!下面这段视频就是基于人工智能 Jetson 生成的剧本拍摄的科幻短片:
No.10 打破产业与学界之间的壁垒,大学与企业共同推进技术进步
里程碑意义:★★☆☆☆
社会关注度:★★★☆☆
多年来积累的深度学习技术研究成果的应用价值正在开始显现,产业界也已经将人工智能作为了重点发展和关注的领域。而为了在未来占据这个万亿级市场的优势,人才和技术积累就成了当前需要投资的关键。
2016 年,我们看到很多学术界的研究者和科学家开始进入到了产业领域,其中包括 8 月份中国科学院计算机视觉资深研究专家山世光创立人脸识别技术公司「中科视拓」、 10 月份卡耐基梅隆大学机器学习教授 Ruslan Salakhutdinov 加入苹果、10 月份加拿大蒙特利尔大学教授 Yoshua Bengio 参与创立深度学习孵化器 Element AI、11 月份斯坦福大学教授李飞飞加入谷歌和卡耐基梅隆大学教授邢波创立机器学习平台公司 Petuum。而其中一些研究者也表示在进入产业界之后仍然会保留在大学内的研究或教学职务。
学术界的人才在向产业界流动的同时,产业界也在凭借自身强大的优势资源产出高质量的学术成果。谷歌、微软、Facebook、腾讯、百度等科技巨头都已经有了自己专门的人工智能研究机构,这些机构不仅在帮助这些公司提升自己的产品和应用,也同时在将自己的研究成果公开发表出来。这样一片欣欣向荣共同进步的发展景象让一贯遵循保密策略的苹果公司也坐不住了,在今年 12 月份,前面提到的该公司的人工智能研究主管 Russ Salakhutdinov 在 NIPS 2016 上宣布「苹果的人工智能研究团队将公开发表他们的研究成果并更多地参与到广阔的学术圈中去。」之后不久,苹果发布了其第一篇人工智能论文《Learning from Simulated and Unsupervised Images through Adversarial Training》。
闭门造车的时代已经结束了,要想在人工智能时代继续保持领先,方法大概只有一个:参与进来。
总结
除了上面的盘点中所提到的十大焦点,2016 年的人工智能领域还有更多值得我们关注的焦点事件和重要研究,其中至少包括:更为逼真的语音合成(WaveNet)、稳步推进的图像识别……此外在视频预测、阅读理解和生成对抗网络等领域也出现了一些非常之关注的研究进展。
另外,在一些相关的其它技术上,我们见证了很多重要的进步,其中至少包括量子计算、光计算、生物计算、脑机接口、机器人技术和新型加密技术等领域也都出现了一些重要的研究或应用进展。
现在,人工智能在我们的日常生活所发挥的作用正变得越来越大,一般人的生活在很大程度上已经离不开各种应用背后的人工智能技术了;所以,我们可以总结说:2016 年我们已经进入了人工智能时代。新的一年,人工智能又将会引来怎样的机遇和催生出怎样的应用和故事,就让我们拭目以待吧。
关注网易智能菌(微信公众号:smartman163),获取专业人工智能资讯与AI报告。