【一线】阿里巴巴王坚:这是一个分布式AI的年代
文/腾讯《一线》薛芳
2018年1月28日上午,《麻省理工科技评论》新兴科技峰会EmTech China于北京国贸大酒店正式召开。
麻省理工科技评论中文版CCO Irene Chen主持了圆桌论坛《云端上的AI风暴》,阿里巴巴技术委员会主席王坚和亚马逊AWS首席科学家Animashree Anandkumar参与了这一话题。
双方就分别就阿里巴巴的阿里云同亚马逊的AWS未来在公有云领域的竞争发表观点;同时王坚也谈到城市大脑的下一发展目标,Anandkumar对AI技术如何推广提出可行性建议。
以下访谈全文:
Irene Chen:我记得在麻省理工科技评论去年的文章当中,有一篇标题让我非常印象深刻,讲到的事情是云端将会成为未来AI决胜的主战场。今天在台上两位,是来自阿里巴巴的王坚博士与来自亚马逊AWS的Anandkumar。毫无疑问这会是将来全世界最重要的两家公有云平台公司,甚至于可以说这会是两家未来最重要的AI公司。
第一个问题想先请教两位,怎么看待阿里巴巴的阿里云同亚马逊的AWS未来在公有云领域的竞争?
王坚:其实,关于云和AI的关系,我觉得可以用另外一个角度重新描述一下,我把云想象成Internet(互联网),因为Cloud(云)这个词有很多的歧义。实际上是说,将来整个Internet是AI非常重要的承载主体。
此外,AI与计算的关系也很有意义。云计算也是我们做城市大脑的原因。AI,或者是我说的MI(机器智能),是消耗计算资源最多的应用场景。您讲的AI in the Cloud(全部在云端)在未来至少有两个事情是非常激动人心的: 1)AI一定是在互联网上,尽管可能是在互联网的设备上,但也是在互联网上的;2)它所消耗掉的计算资源可能是史无前例的。
Animashree Anandkumar:我很同意,刚才我也听到有嘉宾说到AI是就像是新的电力,那么在我看来,云就是电网,能够让不同的硬件或者是结构都能够接入进来。因此,需要确保AI在不同的机器和设备上都可以使用。所以我非常同意王博士的观点,我们需要有一种灵活性的概念,云到底是什么。
Irene Chen:现在我们看到很多的AI应用都是在终端,比如说智能手机、智能音箱,但AI需要很强大的运算能力,所以云应该是AI的一个归属平台。可不可以谈一谈,在未来我们所谓的客户端跟云端上的AI要怎样发展:是要进一步整合、还是透过什么机制去连接,才能够让AI或者是MI的效率更高?
Animashree Anandkumar:这个领域发展很快,深度学习除了学习本身,应用场景也很重要。目前在云端和设备上所做的改进,在未来要考虑一下如何在这两端之间进行资源的分配。我刚才提到,大多数的计算都是发生在云端上的,但是它很昂贵,需要很多的数据。如果要把这个模型载入到终端设备上,我们现在还面临的一个挑战就是如何压缩模型,让它能够在适用不同体量的设备。
比如阿里在这个方面有很多经验可以分享,我们也有一个项目叫DeepLens,希望在不同的设备上都能够应用这些AI模型。安装好DeepLens之后,你可以直接运行这些模型进行不同的深度学习。我们看到,有很多物联网的设备都在使用不同形式的AI应用。
王坚:关于AI在终端上还是在云上,我觉得这不是非常准确的描述。我自己的理解,AI一定会既在终端上,也在云上。现在哪怕是一个音箱,都一定是连在互联网上的。实际上,AI已经分布在了互联网上,只不过最后需要一个终端来最终使用。
此外,从我自己做cloud company(云公司)的角度讲,相比于云还是终端,我都觉得 真正的核心还是计算,不论云端还是终端都需要分配计算资源。
但是,AI资源在云端和终端的需求是不一样的。如果在终端上需要一个晶体管的话,在云上一定会用到100个甚至1000个晶体管。也就是对于所谓的分布式AI来说,在云端用掉的计算能力一定会超过终端。 所以我觉得这是一个分布式AI的年代,AI无处不在,一起协同工作才会出现真正的AI。
Irene Chen:谢谢博士,我接下来各自有两个比较短的问题,想请教一下。过去两年您教育市场上很多人有关城市大脑的事情,接下来的两年,城市大脑的下一个阶段目标会是什么?
王坚:我认为下一个阶段的目标,就是让世界上每个城市都取消车辆的限行,也就是让现在所有的道路,因为有数据和大脑,发挥到最高的效率。我认为现在的道路资源是足够的,但没有进行优化。
而更长远的目标,应该不只是像波士顿一样把道路修到地下去。这个世界本来是不需要修那么多路的,我们现在不得不这么做,是因为资源的利用效率不高。今天的中国,每个城市大概都要拿出20%-25%的土地来修路,我们相信,如果经过城市大脑的努力,帮助城市省下5%的土地资源,将为社会提供一笔巨大的财富,也会开启巨大的市场。
Irene Chen:我的接下来一个问题想问Andandkumar,从一个科学家的角度来说,AI要如何进行普及和推广?
Animashree Anandkumar:谈到这点,我认为可以有不同的形式。
其中一点是要确保每个人都能够获得AI。AI是没有国界的,我们想让每一个愿意从事AI研究的人都能够接触到它。有很多的AI实验都需要大量的计算资源,在过去,这是需要超级计算机来完成的。但是现在,云端已经成为了AI走向了大众的途径。所以我们有很多的项目用于研究、教育或者是非营利机构以及初创企业,我们希望他们都能够非常轻易地获得我们的AI研究资源。
第二点就是要实现全球化。当前许多的研究基本上都是使用英语的,比如说语音识别主要是用英语及其各种口音来做实验。但我们希望能够进一步推广,确保不同的地域都有机会进行跨语言和跨文化的识别和研究。我们在输入这些数据的时候,要确保它的多样化和无偏见,即消除性别和任何形式的种族偏见。有了这些数据,我们才能够确保它的输出。
因为,即便是语言这样输入都会有一些偏见。我们把带有偏见的文化输入到AI体系的时候,它会蔓延到整个体系中去,这是非常危险的事情。所以我们有一些全新的研究,去探索公平对于人工智能的意义,以及我们又能够采用什么行动来确保数据的公平性,从而让每个人都能公平地使用资源。
【一线】为腾讯新闻旗下产品,第一时间为你提供独家、一手的商业资讯。