【盘点】2016中国人工智能大事件:从百度深度学习平台到中国脑计划
2017 年元旦,机器之心以 3 分钟视频的方式回顾了全球人工智能在过去一年中取得的发展。开源、无人驾驶、创业、深度学习等词汇似乎成为了人工智能领域的表征,一次又一次的拨动我们的神经。
从元旦的视频总结中,我们能够明显的看到中国在整个人工智能领域的参与度。MXNet、百度无人车、科大讯飞都让我们看到了中国对人工智能发展的推动。
在为春发蓄势的年末,机器之心回顾了国内在 2016 年发生的人工智能大事件。百度无人车体验、开源深度学习平台 PaddlePaddle,多种算法、应用竞赛的举办,商汤、旷视、图普等创业公司新一轮融资的成功,这些种种让我们相信中国会成为人工智能的前沿阵地,如同高盛报告中提到的「人工智能前沿的重要参与者可能会继续来自美国和中国」。
百度开源深度学习平台 PaddlePaddle
在 2016 年 9 月 1 日百度世界大会上,百度首席科学家 Andrew Ng(吴恩达)宣布正式对外开放百度内部 3 年内不断丰富、优化的深度学习平台 Paddle,并更名为 PaddlePaddle:
深度模型:
广泛支持各种深度学习模型,包括 DNN,CNN,RNN,复杂记忆(Memory)模型,NTM 等,支持多种优化算法
模型训练:
支持多机多显卡训练,充分利用机器性能,支持稀疏更新
模型预测和评估:
支持线下多语言(Python/C++)预测接口
据介绍,PaddlePaddle 有着极大的易用性、灵活性、高效性与扩展性。随着亚马逊年底宣布使用 MXNet,深度学习框架之间的竞争是愈演愈烈。
第三届世界互联网大会,百度无人车体验
2015 年底,百度宣布正式成立自动驾驶事业部,且表示「计划三年实现自动驾驶汽车的商用化,五年实现量产。」一年将近,在第三届世界互联网大会在乌镇召开之际,百度无人车邀请了多位嘉宾切身体验百度已经从「测试」走向「试乘」的无人车。
这成为百度继 2013 年启动无人车项目、2015 年底完成多种路段测试、今年 9 月和 10 月分别获得美国加州自动驾驶汽车道路测试许可证和完成加州首次公共道路测试,无人车项目的有一个重大进展。
这也是国内首次第四级别的自动驾驶汽车全程无干预的在全开放城市道路上行驶,投入乌镇运营无人车 15 辆,3 天内超过 200 位乘客规模化试乘,应付了多时段的复杂气象条件。更加重要的是,这是支持 5 款车型的跨平台无人驾驶技术。
腾讯 AI Lab 研究院成立
今年,腾讯成立了人工智能研究院腾讯 AI Lab,专注机器学习、计算机视觉、语音识别、自然语言处理等人工智能领域的研究。但腾讯一直没有对外做过多宣传,机器之心是报道腾讯 AI Lab 研究的第一家媒体。
后来,腾讯副总裁、AI Lab 院长姚星在 2016 年腾讯研究院年会上正式向外公布了腾讯 AI Lab 所关注 AI 四个基础研究领域和 4 个专属研究方向,并且强调说,「AI 对腾讯来说是非常重要的,对整个中国互联网都很重要。」
腾讯大数据开源高性能计算平台 Angel
在 12 月 18 日于深圳举办的腾讯大数据技术峰会暨 KDD China 技术峰会上,腾讯大数据宣布推出了面向机器学习的「第三代高性能计算平台」——Angel,并表示将于 2017 年一季度开放其源代码。
据腾讯数据平台部总经理、首席数据专家蒋杰介绍,Angel 是腾讯大数据部门发布的第三代计算平台,使用 Java 和 Scala 语言开发的面向机器学习的高性能分布式计算框架,由腾讯大数据与香港科技大学、北京大学联合研发。
采用参数服务器架构,解决了上一代框架的扩展性问题,支持数据并行及模型并行的计算模式,能支持十亿级别维度的模型训练。不仅如此,Angel 还采用了多种业界最新技术和腾讯自主研发技术,性能更高、系统更具易用性。自今年年初在腾讯内部上线以来,Angel 已应用于腾讯视频、腾讯社交广告及用户画像挖掘等精准推荐业务。Angel 更是腾讯大数据下一代的核心计算平台。
人工智能华人力量
就像前面所说的「人工智能前沿的重要参与者可能会继续来自美国和中国」,2016 年,我们看到了华人对人工智能发展所做出的贡献,华人力量也逐渐被国际所认可。
华人力量的彰显可从两个维度得见:1. 中国力量在国际学术组织和会议上的存在感和影响力愈发强大,可以看成是中国人工智能快速发展的一个标志;2. 一批优秀的华人学者为 产业 界所看重,其中最具代表性的美籍华人李飞飞。
1. 百度副总裁王海峰当选 ACL 会士
11 月 28 日晚,国际计算语言学会(The Association for Computational Linguistics:ACL)公布了 2016 年 ACL 会士名单。
截至目前,ACL 历史上在全球范围内累计评出过 40 位会士。而王海峰则成为了首位获此荣誉的中国大陆科学家,同时也是 ACL 目前最年轻的会士。ACL 会士评选委员会在对王海峰的评语中写道:王海峰在机器翻译、自然语言处理和搜索引擎技术领域,在学术界和工业界都取得了杰出成就,对于 ACL 在亚洲的发展也做出了卓越贡献。
2. 黄学东、周志华当选 2016ACM Fellow
2016 年 12 月 8 日,世界领先的计算机学会、全球最大的计算机领域专业性学术组织 Association for Computing Machinery(ACM)正式公布了 2016 年当选的 ACM Fellow 名单。今年共有 53 名成员入选。
新当选的 ACM Fellow 中,仅有两位华人:一位是美国微软首席语音科学家黄学东博士,贡献是「对口语语言的处理」;另一位是中国大陆学者、南京大学的周志华教授,当选理由是「对机器学习和数据挖掘的贡献」(for contributions to machine learning and datamining)。
3. 李飞飞加入谷歌
2016 年 11 月 16 日,谷歌宣布其雇佣了两位人工智能领域的顶级研究者:斯坦福大学人工智能实验室主任李飞飞、前 Snapchat 研究主管李佳,这两位华裔女科学家都是计算机视觉行业的专家。
在人工智能风起的今天,科技巨头从学术界拉拢人才已经成为了一种常态,而李飞飞加入谷歌的消息无疑也掀起了轩然大波。从另一个角度来讲,李飞飞作为第一代中国移民,最后成为谷歌人工智能团队新任领导者,也让我们看到了华人力量的崛起。
中国脑计划一体两翼战略,推动人工智能发展
2016 年 11 月份时,中国科学院神经科学研究所、中国科学院脑科学与智能技术卓越创新中心、香港科技大学生命科学部和分子神经科学国家重点实验室、中国科学院自动化研究所在《Neuron》上联合发表了一篇概述论文《China Brain Project: Basic Neuroscience, Brain Diseases, and Brain-Inspired Computing》,介绍了「中国脑计划」在基础神经科学、脑疾病和脑启发计算上的研究进展。
在论文中,作者们写到,「神经科学的一个普遍目标——理解人类认知的神经基础——应该成为「中国脑计划(China Brain Project)」的核心。此外,中国也应该投入资源和研究能力,以满足迫切的社会需求。由主要脑疾病造成的社会压力逐渐上升,所以现在迫切需要一种预防、诊断和治疗脑疾病的新方法。在大数据的新时代,受大脑启发而得的计算方法和系统对于实现更强的人工智能和更好地利用越来越多的信息至关重要。正是由于对这些问题的考虑,中国脑计划项目提出了「一体两翼」战略(图 1)。其中对基本神经回路机制的认知的基础研究提供了输入并且接受来自脑疾病的诊断/干预和脑启发智能技术(两翼)的反馈。」
此篇论文的作者包括:蒲慕明(Mu-ming Poo)、杜久林(Jiu-lin Du)、熊志奇(Zhi-Qi Xiong)、叶玉如(Nancy Y. Ip)、徐波(Bo Xu)、谭铁牛(Tieniu Tan)。
神经机器翻译,不止谷歌一家
2016 年 9 月底,谷歌宣布将其神经机器翻译技术(GNMT)整合到了其谷歌翻译应用中,引起了很大关注。但实际上,利用人工智能做机器翻译的企业并不只有谷歌一家,中国的百度、讯飞、搜狗等公司都在 2016 年拿出了一些值得关注的机器翻译上的新应用。
在机器之心 2016 年对百度 NLP 团队和百度首席科学家吴恩达的采访中,他们就曾谈到百度其实也非常早的就进入到了神经网络机器翻译领域。已当选 ACL Fellow 的百度副总裁王海峰博士就曾告诉机器之心:「我们从 2014 年开始便尝试做基于神经网络的翻译系统,2015 年发布在线翻译系统的时,BLEU(Bilingual Evaluation Understudy)指标已经比传统的 SMT(统计机器翻译)系统高六、七个点。我们同时还开发了离线版本,可以在手机上使用,当时学术界对于深度学习的翻译方法到底是否实用还有一番争论,我们很早就发现基于 Attention 机制的 Seq2Seq 深度学习模型是有用的,经过多次实验验证,在很多集合上超过了传统方法。同时,针对 NMT 本身存在的一些问题,进行了技术攻关,短短 3 个月的时间便完成了开发和上线。当大家还在讨论 Attention 机制时,我们已经结合了原有的统计方法上线。可以说,百度翻译是全球首个互联网神经网络翻译系统。」
除了百度外,讯飞和搜狗也在持续投入机器翻译技术。2015 年,科大讯飞曾在美国国家标准技术研究院(NIST)组织的机器翻译大赛(Open Machine Translation Evaluation,NIST 2015)中取得了全球第一的好成绩。而在 2016 科大讯飞年度发布会上,该公司正式发布了「晓译翻译机」。据介绍:这款机器基于科大讯飞机器翻译的国际领先技术,达到了英语大学六级的水平,能够实现语音输入后中英、汉维的实时翻译,具有易用性、稳定性、安全性等特点。
搜狗也在 2016 年 5 月份上线了英文搜索(后在 12 月份升级为搜狗海外搜索频道并新增了搜狗翻译频道)。搜狗英文搜索可提供跨语言检索功能,可自动将中文翻译成英文进行查询,再生成英文查询结果。在 11 月的乌镇世界互联网大会上,搜狗展示了机器同传技术,可将演讲者的中文同步翻译成英文并实时上屏。
算法与应用大赛
数据竞赛是今年中国人工智能领域的又一亮点,学术界、 产业 界纷纷举办数据竞赛来争取人才,挖掘新技术的产业应用。当然,以下三场竞赛并不代表 2016 年内举办过的全部竞赛,但管中窥豹,希望大家能从中洞见数据竞赛在人工智能发展中带来的益处。
今日头条 2016 Byte Cup 世界机器学习比赛:2016 年,中国人工智能学会主办,今日头条、电气电子工程师学会(IEEE)中国代表处协办了 2016ByteCup 国际机器学习竞赛。这场数据分析竞赛的主题是:如何在社交问答系统中精准地匹配专家和问题。
据了解,此次数据竞赛共有 1000 多支队伍参赛,冠亚季军队伍分别是 brickmover、天穹战队和西电战队。
上海 BOT 大数据应用大赛:今年上海大数据产业基地(市北高新)、上海大数据联盟、英特尔(中国)有限公司和华院数据技术(上海)有限公司联合主办,机器之心协办了国内首个专业化人工智能大赛「2016 上海 BOT 大数据应用大赛」。在计算机视觉与人工智能聊天机器人商业应用这两大热门赛题上,全球近 400 支专业团队进行了角逐。本次大赛从 2016 年 9 月 1 日初赛开始到 11 月 11 日总决赛结束,经历了三个多月。
滴滴 Di-Tech 算法大赛:今年上半年,滴滴研究院举办首届 Di-Tech 算法大赛,这是一场面向全球大数据人才的算法竞赛。滴滴通过开放国内真实的出行数据,用最炙手可热的研究课题征集更聪明的解决方案。而且此次比赛中获得的解决方案有机会直接应用于「滴滴出行」产品端。
融资:图像识别公司屡获巨额融资
创业、融资是体现人工智能热度的另一个维度。2016 年,我们看到人工智能成为了最受资本市场追捧的领域之一,机器之心很早就关注的一批创业公司接连获得高额融资。下面这三家融资的成功引起了业内极大的关注。当然,这并非完全性统计。
1. 旷视科技:
旷视科技(Face++)是一家专注于机器视觉和人工智能的技术公司,是国内人脸识别领域知名的创业公司。据机器之心获得的消息称,旷视科技获 2000 万美元新一轮融资。
旷视科技成立于 2011 年,创业之初获得了联想之星的一笔天使融资;2013 年获得创新工场百万美元 A 轮投资。2014 年 11 月,获得 2200 万美元 B 轮融资,2015 年完成 B 轮 4700 万美元融资。
2. 图普科技:
据机器之心一手消息称,图普科技已经于今年 9 月完成了新一轮融资,金额为千万美元,由晨兴资本领投,北极光创投跟投。
图普科技由微信创始团队成员之一的李明强创办,主要做基于图像识别技术的第三方内容审核 服务 ,在识别色情、暴恐、时政敏感信息、小广告等违规 图片 和 视频 方面市场占有率领先。
3. 商汤科技:
2016 年 12 月 14 日,商汤科技宣布完成 1.2 亿美元新一轮融资,本轮由鼎晖投资,万达集团、IDG 资本、StarVC 等投资方共同参与。此前商汤科技,曾于 2014 年 11 月获得 IDG 资本的千万美元投资;
商汤集团是一家科技创新公司,致力于引领人工智能核心「深度学习」技术突破,构建人工智能、大数据分析行业解决方案。目前,商汤汇聚了一支庞大的深度学习算法研究团队,拥有上百名深度学习研究人员。