腾讯副总裁姚星解析腾讯AI研究
腾讯AILab(腾讯人工智能实验室)研发的围棋人工智能“绝艺”电圣战执黑中盘战胜了日本新锐棋手一力辽七段,获得冠军。
姚星带领的人工智能实验室,是腾讯首个从事原创科学研究的单位。近日姚星接受 媒体 采访表示AI Lab的定位是,希望引领整个 科技 界,不再是简单的跟随别人。
更新于2017年3月28日 06:25英国《 金融 时报》中文网编辑 史书华
问:从去年 4 月成立到现在, AI Lab 团队是如何组建起来的?
姚星:AI Lab目前大约有50位科学家和200名工程师。Lab主要从事四个研究方向:计算机视觉、语音识别、自然语言处理(Natural Language Processing)和机器学习(Machine Learning)。大部分的Lab成员都是海外高校的博士,有一定工作经验。我们最近也开始招纳刚毕业的实习生来学习。
问:刚才提到的四个 AI 研究方向,是否暗示了腾讯未来的 AI 产品发展?
姚星:如果我们把AI分解,可以分成“感知”和“认知”,感知是指看得到的,听得到的,所以有视觉和语音研究。而认知,是对语言的认知。简单的分解AI体系,就正好落在我们的前三个方向(计算机视觉、语音识别、自然语言处理),而机器学习更趋向于研究深度学习,深度学习是目前AI算法的基础。所以我们如此构建Ai Lab的研究,不是只从业务层面上去表达,而是想覆盖AI的主要研究方向。
问:最近,腾讯 计算机围棋“绝艺” 的表现受到各界瞩目。可以谈谈当初怎么会想带绝艺出国参加比赛?
倒不是说带出国,而是想把我们在AI上的研究和同行交流、分享。
比赛前,我们从来没承认过绝艺是腾讯的一款AI项目。时间回到2016年年初,一些同事平常比较关注研究论文,在一、二月左右在《自然》(Nature)期刊上看到Alphago的研究,在那篇论文出来后一两个礼拜,我们也尝试做了一个很小的版本,大概介于围棋业余几级的水平。当时做出来觉得很有趣,就保持了一个小团队在做。
同一时间,腾讯创始人、当时的CTO 张志东(目前已退休)召集了一些人吃饭,他提到,腾讯已经是家市值2000亿美元的公司,应该要肩负更多的科技使命。我还记得他当时给我看了一部谷歌旗下公司Boston Dynamics的机器人影片,认为我们应该成立一个像谷歌的X Lab(编者注:指Google X,是谷歌从事前沿科技研究的秘密单位。2015年谷歌公司重整,现隶属于Alphabet公司,更名为X)。张志东本身也会下围棋,聊天当中无意提到,我们是不是也该做一个类似Alphago的东西,让AI团队去练手一下?
当Alphago在去年3月战胜李世石之前,我们其实就已经推出绝艺的前身“Wei Go”。但Go是英文围棋的说法,围棋是中国国粹,和公司高管讨论后,想改成具有中国特色,中间也陆续改了其他名字。大概在2016年下半年吧,名字换成“绝艺”,出处是来自于唐代诗人杜牧送给围棋国手王逢的诗句,“绝艺如君天下少,闲人似我世间无”。事实上绝艺的英文名字“Fine Arts”还是DeepMind共同创始人兼首席执行官杰米斯•哈萨比斯(DemisHassabis)帮我们翻译的,他关注到我们的AI,问我们是不是有个“Fine Arts”?用它来作绝艺的英文名字也挺好的。
问:目前 AI 技术已实际应用到哪些腾讯产品上?
姚星:腾讯内部实际上已经有非常多东西开始在运用AI了。比如 微信 里的语音识别,就是语音识别的AI技术。还有天天P图的美颜功能,是通过计算机视觉去做的。最近大家看到的滤镜转换功能,也是AI的技术。
目前绝大部分的AI应用都还是在工具层面,所以老百姓感觉到的AI和我们定位的AI还有一段差异。当然AI Lab里还有做 游戏 类、 社交 类的AI,像沟通类的chatbot(聊天机器人),随著技术成熟度提升,我们慢慢会包装成产品型态。
问:具体来说,未来会有什么样的 AI 产品规划?
姚星:目前研究方向有四个,绝艺只是游戏AI,我们还有社交、内容、云AI,这是四个产品大方向。先说游戏 AI,绝艺只是很小的片段,未来MMOG(大型多人在线游戏)、 手机 游戏都会有AI元素。另外,社交方面,从小的语音识别、到未来的对话系统、智能助理等等。而内容AI上,更多的内容会通过AI技术去推荐、去分析用户喜好,原来是从文本,现在能通过视频、图片去推荐。而在云AI领域,我们会把我们AI能力开放,降低小公司使用门槛。
问: AI 是目前中国非常火的话题。您认为中国的 AI 发展目前处于什么样的阶段?
姚星:如果和美国比,中国的科技发展坦白说在基础研究和理论上还是有一定的差距。但为什么AI会成为腾讯、甚至所有中国 互联网 公司都会竞逐的竞技舞台?我认为有几个原因,和原来的基础科学研究有些不同。
第一是人才,全球AI研究人才里面,华人非常多。我看过一个报道统计,在2006到2016年里,近两万篇最顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%,人才不落后。
第二,AI的能力是拼大数据,如何在海量数据之下,进行深度机器学习。数据怎么产生?靠人口基数,从这点来看,中国有很好的优势,互联网用户数是领先欧洲、甚至是美国。
第三,互联网产品的应用状态,中国是领先的。虽然先进国家发达,但在互联网应用上是普遍落后于中国,包括4G环境、智能手机普及率、App的丰富度,中国也是领先。
但除了以上环境优势,还要考量原创性,我们在这上面要多借鉴发达国家的开创精神,能沈下心、能长期做科技研究。如果两者能结合,在不远的将来,中国在AI应用上有机会引领世界。