【一线】Emotech联合创始人庄宏斌:深度学习颠覆界面
文/腾讯《一线》薛芳
2018年1月28日上午,《麻省理工科技评论》新兴科技峰会EmTech China于北京国贸大酒店正式召开。Emotech 联合创始人兼CEO庄宏斌发表了演讲——《在人工智能时代的产品探索》。
以下附上全文演讲:
我们创立Emotech的初衷是希望让技术变得更人性化、更有温度。大家可能会问,我们为什么从情感切入?用一句话简单来说,不是智能的机器是否能具备情感,而是说如果没有情感的话,系统是否还是智能的。
从PC时代到移动互联网时代再到人工智能时代,技术的变革给世界带来了什么样的巨大变化,以及在这些不同时代中的产品形态都是什么样的。我会援引我们打造OLLY机器人中的例子。
移动互联网带来了什么样的变革?
第二,人与技术之间的互动。技术的变革将个人电脑这样powerful的系统缩小成了手机式的便携般大小,通过触摸式的系统与人互动。其所引起的变化直接反映在2013年公布的一组数据,人跟技术的互动时间变为PC时代的两倍,并且逐年上涨。
第二,手机上的摄像头和定位系统。2017年苹果公布的最受欢迎的应用中,像Snapchat、Instagram、Google Map、Uber都是移动互联网时代的产品,它们都是在有效利用了摄像头和GPS后而开发出的产品。
AI时代技术的变革带来了什么?
第一,深度学习技术从很大意义上颠覆了界面的概念。它提供了强大的认知功能,包括语音、文字、图像、对话系统等。我从两方面展开谈一下:
1)在AI时代,信息互动的方式已不仅仅局限于图形化,而是多模态的形式(可以是图像、文字、声音、触摸等),这不仅是文件格式的不同,而是机器学习对文件形式的变革。机器学习使计算机系统能更好地去理解当前的环境,更好地理解用户。
2)互动方式不再仅仅是数据化,而是越来越多的和物理数据产生互动,比如自动驾驶等硬件设备。当然还有数字和物理之间的互动,比如增强现实。
简单的总结,每一次技术都推动着界面系统产生翻天覆地的变化。以前很多在图形化界面时代产生的系统,在AI时代势必会产生很大的变革。
第二,用户跟技术之间交互的流程。
在移动互联网时代,图形化界面时代的一些互动的流程基本上都是从一个界面跳到另外的几个界面再这么互动下去。特点是比较可控,但也会比较固定。
在AI时代,我想提出一个概念,即更开放的互动方式和互动流程。比如现在有很多的自然语言理解是没有被预先设计好的,用户和系统互动的时候有可能是非常开放式的主题或形式。系统需要去理解,去执行这样的操作和互动。对话系统也带来了新的变化,以前的流程从步骤开始,1234往下走。而在新的互动方式下,顺序有可能被打乱。
这个时代的交互系统需要具备新的功能,比如生成式的技术。现在很多界面甚至可以由系统自动产生,而不是一开始就由设计者定义好。我们的机器人通过使用者的性格系统,产生一套设计的语言。通过LED的点阵,AI通过生成的不同的颜色模式、动画形式来传递不同的性格、情感。
如果这个机器人的性格发生变化,它跟用户互动的方式,界面的交互也会随之改变。这些都不是被预先定义好的,而是由AI的系统自然生成。
第三,本能性的交互。
现在的交互系统,还有产品设计的形态变得比以前复杂很多,更开放,更flexible。
我认为,人们跟技术互动有这样一种趋势:比如从最早的象形的界面,发展到图形化界面,最后到触屏式的界面。从人们去适应技术发展成到让技术更好的适应人们的习惯。
所谓的本能是更靠近与生俱来的,不需要花时间再学习新的交互方式,比如敲代码需要用键盘、鼠标其实都不是与生俱来的。随着AI技术的发展,我坚信很多本能性的反应会被技术更好地支持,被设计到交互系统里面去。
在AI时代,有几种本能性的交互的特性。比如人类对语言的学习就是一种本能,声音就是一种本能,小朋友很小的时候开始用手跟这个世界周围的物件发生互动,这其实也是一种本能。再比如智能音箱语音式的、对话式的系统,比如AR,其实也是用手势再跟物理模型或是数据模型产生互动,这些都是本能。
为什么本能反应如此重要?我认为它很大程度提升了用户体验,像现在比较火的AI芯片一样,为什么AI芯片会让功耗变得更小,是因为有很多逻辑被写在了硬件里面。我们也可以把本能看作硬件里面的逻辑,它们是与生俱来,不需要中间再去转化。
还有一些比较简单的强烈情感也是与生俱来的。我举一些我们产品上的功能为例。比如我们通过机器人不同的运动方式去传递给系统它要表达的情感,不需要再学习,只要一看到,就能感觉到。OLLY它就可以根据用户本身的性格发展出一套相适应的模式,展示各种各样的性格。
【一线】为腾讯新闻旗下产品,第一时间为你提供独家、一手的商业资讯。