阿里A.I.Labs王刚:从研究到商业化,AI的命门是应用场景
【编者按】现在,人们已经知道AI时代最大的问题是如何实现AI的产品落地,但是这条商业化之路该怎么走,往哪里走,由谁牵头走,都是个未知。本文采访对象是阿里人工智能实验室成员之一,结合自身从学术研究到技能应用的转型,畅谈了该如何实现AI商业化。
本文发于人工智能头条,经亿欧编辑,供行业人士参考。
在刚刚过去的6月份,阿里 人工智能 实验室迎来了成立一周年的纪念日。这是一个比阿里iDST还神秘的部门,业界鲜有人知道它的存在,直到日前实验室首款终端产品 天猫精灵X1 的发布,这支神秘之师才正式成为镁光灯下的焦点。
王刚 博士今年3月加入 阿里人工智能实验室 ,在此之前,他在南洋理工大学担任副教授(终身教授),专注于深度学习的研究,是众多转投工业界的学术专家之一;加入阿里人工智能实验室后,他负责的是机器学习、自然语言理解,和计算机视觉等技术的研究以及落地。
在王刚博士看来,即便身处学术界,在做学术研究的同时,也需要挖掘技术的经济价值。 事实上,早在南洋理工大学期间,王刚博士和其研究团队就研发出了多款人工智能商业化产品。“在学术界的时候我就对技术的商业化和落地非常感兴趣。”王刚回忆道。但他深知, 人工智能产品要实现商业化必须要了解用户,要找到合适的应用场景,同时要有好的用户体验也离不开数据的支撑,这些都是高校最匮乏的资源,这也是他选择迈进工业界的主要原因。
采访正文:
1、加入阿里之前,您一直在学术领域,是什么让你选择从学术界向工业界的角色转变呢?
王刚:以前在学术界的时候我就对技术的商业化和落地非常感兴趣,因为我觉得,我们做工程学科的研究人员,除了发论文,也应该要强调这种技术的经济价值,让技术转化为产品。这和基础学科的研究人员还是不太一样的,他们更多的是探索未知的知识,而工程学科应该要为经济和产品服务的。
所以我在南洋理工大学任教的时候就花了很多时间在做高新技术产业化的事情,比如2011年我带领团队做的时尚衣服搜索系统(CHIC Finder),这个产品上线比拍立淘还要早。当时我们做了很大的努力把这个产品推到市场上,但是我发现在学校很难有市场影响力。即使技术做得很好也不能很快的被用户所知道。所以我就开始思考,是不是应该换一个平台做我感兴趣的事情。
另一方面,人工智能技术在近年取得了很大的进展。以前大家认为不能做的很多任务,现在我们都能够用人工智能技术来实现了。人工智能已经处于一个从学术界到大众爆发的一个零界点。基于这样的考虑,我选择加入了阿里巴巴。因为它了解消费者需要什么,也知道如何把技术用最好的形式呈现给消费者。在这样一个平台上去做人工智能技术落地的事情,更容易获得成功。
2、在南洋理工大学,您和您的团队取得了哪些研究成果?
王刚:先说学术方面,我们在人工智能最顶尖的期刊和会议上发了将近有一百篇文章,例如CVPR/ICCV/TPAMI等。这些文章在推进深度学习和计算机视觉研究上都做了较大贡献。例如,我们改进了深度神经网络的设计机理:让神经网络能根据具体应用场景更灵活,更高效地去处理复杂信息,从而提高学习的效果和效率,增加泛化能力。另外我们在语义理解和行为分析等前沿问题上也取得了较大进展,并建立了标准的数据库为学术界和工业界所使用。
学术研究之外,我们还研发了很多商业化系统。除了刚才提到的图像搜索系统,我们还做了药片识别系统:护士发药的时候可能会把药发错,这样的失误非常危险,而这个系统能够根据药品的表面的特征,再通过摄像头,识别出分发的药片是否准确。另外我们还做过辅助驾驶系统,它能够自动检测前面的车辆、车距以及两边的车道。这三个系统都已经成功商业化了,目前已经转让给相关的公司进行进一步的产品的开发。
3、加入阿里之后您的工作有什么变化?和之前在学术界最大的区别是什么?
王刚:从加入阿里到现在,我主要的工作带领算法团队实现人工智能技术在天猫精灵X1智能音响上的落地,工作内容和在南洋理工大学期间的学术研究的区别还是挺大的。 在学术界,我们考虑的主要是技术的前沿性以及潜力;但是把前沿技术转化为产品,要考虑技术的鲁棒性和可扩展性,也有很多技术细节需要去打磨。 很庆幸我们有很多非常优秀的同事,他们在算法和工程上的能力都很强,所以我们能克服落地过程中的很多困难,从而推出天猫精灵这样在未来能改变人机交互方式的极具潜力的人工智能产品。
4、虽然最近两年人工智能很火,但是有一个比较现实的一个问题:无论是学术机构,包括一些企业现在大多都还是处于研究的阶段,您认为人工智能实现商业化最大的挑战是什么?
王刚:无论是在学术界还是工业界,人工智能最近的发展非常迅速。也可以看到在人工智能商业化这个事情上,我们还是取得了非常大的进展的。像前文提到的我们已经发布的天猫精灵,能让人机交互更自然,更轻松,更容易,这背后就是大量的人工智能技术在支持。
但是很多人工智能机构确实遇到了商业化的难题,一个比较大的原因就是没有找到合适的应用场景。 细化一下,又有几个可能的原因,例如不了解用户真正的需求,不知道现在的技术的能力界限:能做什么和不能做什么,不知道怎么用合适的产品形式把技术包装起来。所以实现人工智能商业化需要同时有优秀的产品团队和技术团队,两者是缺一不可的。
5、人工智能在技术上有哪些挑战呢?
王刚:我们可以看到现在还是需要大量的训练样本去训练深度学习系统。不过在很多领域我们很难找到这么多的训练数据。要想人工智能取得进一步的发展,就需要去解决训练样本比较小(小数据),或者是没有训练样本的问题。如果能把这个问题解决好,那么人工智能大规模的应用就到来了。我们实验室在这个前沿性的问题上也进行了很多的探索。
6、实验室已经发布了首款产品——天猫精灵X1,能否介绍一下这款产品的核心技术?
王刚:这是一款大众消费级的语音终端产品,产品包含了很多人工智能的核心技术,例如自动语音识别,自然语言理解,对话生成,TTS,知识图谱,还有个性化的决策和执行等。
7、阿里人工智能实验室专注消费级产品,您认为云上的人工智能和终端人工智能如何协同工作?
王刚: 消费者只会在乎产品给他们的最终的智能的体验,而不会特别关注人工智能是在端上实现还是云上实现的。 所以我们做消费级智能终端也是很关注云端协作的。因为如果我们只依赖终端,就存在一个问题:终端的计算能力一般都比较弱,这就导致返回的结果可能不准确;另外,终端只植入本地的信息,它不知道其他的端的信息,其智能的判断也不会特别完美。当然,在终端实现人工智能也有优点,就是它没有延迟,因为它不需要把数据传到云端:当数据是大量视频流量数据时,传输到云端就成为了瓶颈。
反之,云端实现人工智能会产生传输上的延迟,但是它又具有更强的处理能力,也能够接触到更多的信息。
因此,找到二者结合的平衡点才是关键。怎么优化,怎么能够做好这样的配置,取决于我们的应用场景。