AAAI执委杨强:中国的人工智能有弯道超车的机会
(原标题:这一轮人工智能的“浪潮”,中国有弯道超车的机会!)
21世纪经济报道-飞笛资讯研究员 丘慧慧 蔡杨 深圳报道
2月4日-9日,与中国农历春节撞车的AAAI(National Conference of the American Association for Artificial Intelligence)国际人工智能年度大会,意外地成为历史以来华人“声音”最高的一次大会,不仅参会人数占比达到了30%,与美国持平,论文提交、被录取的数量也达到了与美国不相上下的30%。
华人在人工智能领域的“崛起”意味着什么,将会扮演什么角色?本报飞笛资讯研究员就此采访AAAI唯一华人执行委员会委员、香港科技大学计算机与工程系主任杨强。杨强教援是迁移学习、数据挖掘和自动规划领域科学家, 2016年当选为AAAI执委,他同时也是IEEE协会、国际模式识别协会(IAPR)以及美国科学促进会(AAAS)的院士,并担任国际顶级学术会议KDD、IJCAI等大会主席。除了在学术界享有诸多荣誉,杨强在产业界的参与度也极深,他曾参与创建华为诺亚方舟实验室并曾担任首期主任,奠定了华为人工智能、大数据等技术的发展方向,同时担任初创公司第四范式首席科学家。
论文录取数量与美国持平
《21世纪》:首先,你能分享一下对本次AAAI大会的一些观感吗?
杨强: 这次大会地点在旧金山,那儿有很多科技公司,今年大会反映了几个特点,第一点就是本次大会参加的人数是近20年来最多的。再往前的话就是80年代,那是人工智能历史上第二次热潮,当时参加的人数在5000以上,这一次有2000多人,我们看到现在AI很热,估计明年会更热;第二点就是本次大会参加的中国学者很多,好像有几百人。而且今年中国学者的投稿量和录取量都和美国持平,都占到30%,这和往年相比很不一样。往年的情况是:中国人的投稿量与美国一样,但是录取率比美国低,所以这个是一个不小的进步。
《21世纪》:本次参会的华人里面,学者、商业界各占多少?
杨强: 这两年来参加大会的中国公司变多了,特别是小公司。从赞助商名单也能看出来,像腾讯这种传统的互联网企业以往就比较常见,但是一些小公司开始冒出来了,像小i机器人、今日头条、猎豹等等。当然,他们参会也是肩负着招聘的任务,我想,他们可能业务也是想往北美发展,在北美建立分部,或者打入北美市场。
《21世纪》:你觉得大陆与会人数增加对整个中国AI的发展意味着什么?
杨强:中国学生对AI的热情十分高,而且都非常年轻。像我参加的两场会议,大概有一半都是中国学生在上面做演讲,英文都特别好。不过我也看到,中国这边还是学生参加为主,老师参加不多。在西方的话,还是很多都是老师。
中国原创性仍不足,迁移学习或为亮点
《21世纪》:这两年人工智能非常热,如果我们冷静下来想,从更长的发展周期看,中国在AI领域处在一个什么阶段呢?
杨强: 我觉得中国学生对AI感兴趣可能还是出于工作机会的考虑。研究方面,比较原创的突破还是比较少。比如,今年会议的最佳论文颁发给了斯坦福大学的Russell Steward。他的思路其实挺简单,就是一种跨领域的想法。一个学物理的学生在深度学习里面听到一个问题,就与物理知识结合起来做了一个新的做法。像这种跨领域又比较新奇的想法,我觉得是值得我们中国学生学习的,我们做老师的也该多带头鼓励学生做一些原创。现在中国论文数量上,包括质量上现在也赶上来了,但是原创方面还是不足,而这正是比较难的地方。
《21世纪》:美国甚至有报道说深度学习方面,中国已经超越美国成为领导者,你同意这个观点吗?
杨强: 领导者这个词不对。因为深度学习是不断发展的,研究领域的领导者应该是开拓新的领域,而不是在原有的基础上深挖。举个例子,把一个10层的深度模型拓展到100层甚至1000层,我觉得这个确实是一个进步,中国人目前是这个层次,但这些在我看来并不是一个原创。但如果说一开始发现把层次加深可以大幅提升图像识别的效果,把深度学习图像识别扩展到自然语言,或者甚至扩展到机器人控制,这些是属于原创的。到今天这些原创都不是我们中国人做的。
《21世纪》:你觉得中国的人工智能可能在哪个领域领先世界呢?
杨强: 我刚才提到的,一个是迁移学习。所谓迁移学习,就是说利用这两个领域的相似度,把你的模型在新的领域使用。这样的话,在新的领域,咱们用小数据就可以了,中国人管这个叫举一反三,如果我们希望机器像人一样学习,迁移学习是一个很有希望的方向。
第二点,人工智能在工业上的一大瓶颈就是找不到数据,或者找不到高质量数据,如果有了迁移学习,那就把这个门槛大大降低了,我们用小样本数据也可以学习。我们最近出的一个论文是说两个距离很远的领域也是可以使用迁移学习的。只要你能找到一个路径,这个路径上找一些垫脚石,就像摸石头过河一样,那两两之间可以迁移,最后你就可以迁移到目标。这个思路还是挺新的,我觉得后面会有很多人跟着做,最近我看到DeepMind就给出了一个与这个思路类似的算法。
《21世纪》:迁移学习已经在哪些具体的行业领域使用了?
杨强: 百度在垂直搜索上就用了很多迁移学习,今日头条在建立个性化模型上也用到了,像华为在工作中也用到了很多,还有腾讯广点通。西方也是一直在推广,比如说手写识别、房地产价格预测、卫星图像识别、疾病的诊断、基因的处理、在线产品推荐等都有应用。在金融领域也比较热,已经有好几个挺好的端倪了,像彭博、Kensho这些智能金融公司都开始有这方面的应用了,包括智能投顾和投研。还有微软的科学家把迁移学习用在城市大数据上,可以做城市污染的预测。
“这轮AI热更脚踏实地”,金融、医疗等行业成功概率大
《21世纪》:你怎么看这一轮AI浪潮呢?
杨强: 和1980年代的热潮比,我觉得这一次的人工智能发展更脚踏实地,原因就是有大数据和计算能力,而上一次还是以人为主。现在有一个新的名词叫端到端,就是说进来的是数据,出去的就是一个决策,中间尽量不要有人。因为一旦有人插在这个系统中就很危险了,就好比你把一件重要的事委托给一个不认识的人去做,就不靠谱了。1980年代就是发生了这么一件事儿,那个不靠谱的人就是“专家”,因为没有办法把专家库给完全的描述出来。而现在这个大数据就是把当年的那个瓶颈突破了,就是说我们现在能找到大数据,高质量的数据来代替专家。
所以我觉得这一次的人工智能几个大的方向,比如视觉、无人驾驶这些方向都是对的,而且都马上就能用。当然,现在也有泡沫,就是大家都觉得这个方向很好,但是谁也没有见过这方面的数据,这个方向就不靠谱、泡沫比较大。
《21世纪》:你觉得泡沫最少、成功的可能性最大的会在哪些领域?
杨强: 我觉得其实有一些已经成功,比方说,搜索互联网搜索的广告推荐,像淘宝、京东上面的电商推荐,移动应用的个性化推荐,智能家居的如亚马逊的Echo,这些都是在一个比较窄的领域收集了大量的数据,然后能解决垂直领域的问题。在这些领域回报会非常快的。
还有就是金融行业,因为金融领域数字化程度非常高,数据都是大规模存下来的。另外,在医疗领域里也会找到人工智能成功的领域,比如医疗图像的识别,比方说癌症的识别,体检的各种片子的扫描识别等。但是,如果把这个领域做得太宽的话,其实还是没有足够的数据,比方说,医疗诊断。诊断需要和病人的问答,这需要有足够的知识,能够一针见血,不能让用户很烦。这需要更长时间的积累。对于这个领域,现在的数据还远远不够。
《21世纪》:你觉得当前哪些AI应用误解和泡沫相对大?
杨强: 我们看百度参加的最强大脑,容易误解在视觉这些领域机器已经超过人了,其实不是的。在一个通用领域,机器还是比不上人的。比如小冰,大家可能觉得它很厉害,但是你真跟它聊严肃点的事,完成一个具体任务,它就聊不了,原因就是没有足够的这方面的数据。再比如,最强大脑里面那些领域,如果你换到一个实际的场景,人可以在很暗的情况下,在信息不全的情况下,也可以凭印象一下子识别出对方,机器就不行。而且人的能力是多维的。就是人有第六感,我们所说的第六感其实就是一个综合的、经过过滤处理的信息。机器现在只有一个个单一的维度,还没有把几个不同方面结合起来的这个通用的能力。这就是我们刚才说的知识提升、迁移的能力。
中国有弯道超车的机会
《21世纪》:这一轮人工智能发展对中国来说会不会有一些机会?
杨强: 中国机会很多。一方面是中国可以实现工业革命延续的一个弯道超车,这一轮人工智能并不是一个新的革命,而是18世纪工业革命自动化的一个延续,技术一旦掌握到手里,是可以迅速扩展到做全世界的生意,所以这对于中国起到了一个弯道超车的作用。第二是对中国本身经济结构也是调整。我们过去的改革开放时间比较短,所以还有很多不合理、效率低下的地方,通过这波浪潮推动,就形成了一种新的竞争。竞争才能带来进步,所以对于内部经济结构的调整应该说是有利的。
《21世纪》:在这一轮弯道超车过程中,学界、产业界、政府应该做什么?
杨强: 我觉得学界还是要做比较长期一点、基础一点的工作,就比方像我刚刚说的迁移学习可能就是一个比较基础的研究。但是另一方面,学者毕竟是人,喜欢在自己比较熟悉的领域长期地做研究,这就导致大家都在耕耘自己的自留地,没有一个新的和大的方向。
什么叫大的方向,我举个例子,1960年代美国的肯尼迪总统提出了登月计划,这就是一个大的方向。美国军方提出了种种新的研究可能性,比方说像无人车比赛,包括现在的双腿机器人比赛。这种方向的引领只有政府来做,要把目标定得非常长远,然后又可以检测,看是不是做到了,通过每一年的大赛;这个大目标、大方向的建立,是政府应该做的,同时,这也是对政府的一个很大的考验吧。
在和学界的合作方面,我觉得中国的工业界已经做得很好,在某些方面比西方都要好。举个例子就是比方说我们跟微信的合作,或者和国内其他公司的合作,在这些合作中,他们都很慷慨和开放,我的学生可以使用他们的数据,可以把我们设计的东西在他们的平台上实现。相比之下,我们过去跟西方公司的合作就不太深入,即使有合作,彼此之间还是分得比较清楚,我们做的东西也不知道是不是有用,这样就不太容易做真正意义上的合作。这一点上,中国有很大的潜力。
《21世纪》:有一个观点是说,中国在制造业的优势有助于人工智能在工业上弯道超车,你认同这种观点吗?
杨强: 我觉得关键不是在于硬件,差别最大的应该还是数据,而且数据是与文化相关的。举个例子,就像今日头条这样的信息分发软件在中国非常靠谱,因为中国人喜欢碎片化阅读。但是美国人不喜欢用碎片的时间来看新闻,大家吃饭的时候也没有看手机的习惯,自己开车也看不了手机,所以这就是文化的不同,导致技术的切入点不同。在美国也有类似今日头条的公司,做的也不比今日头条晚,但是就一直没做起来,用户数量远远不如今日头条。所以我觉得还是要发展跟自己国家文化相关的人工智能应用。
关注网易智能菌(微信公众号:smartman163),获取专业人工智能资讯与AI报告。