Benedict Evans:关于Echo智能音箱引发的UI思考
编者按:软件蚕食世界。随着越来越多的东西被虚拟化,软件开始定义一切。但是有时候在消费者侧这个过程却会反转:一部分软件功能被取出来固化到硬件里面。这又是什么逻辑呢?我们看看A16Z的合伙人 Benedict Evans 这次又有什么样的 脑洞 。
移动手机和随后的智能手机吞噬其他产品已经有很长一段时间了——从闹钟到照相机到音乐播放器等等,这些都从硬件被变成了app。但是这个过程有时候也会逆转—— 把智能手机的一部分取出来,包装到壳里面 ,然后旧酒装进新瓶卖。一开始这种做法非常简单,就是处在智能手机供应链的企业利用自己生产的组件创造出新型产品来,最明显的例子是GoPro。不过现在我们又有了一些新的思考线索。
首先,有时候我们解绑的不仅仅是组件,还包括app,尤其是app的组件。我们 将手机上的一个输入或者输出取出来然后放到新的上下文里面 。于是就是GoPro是智能手机摄像头的替代品一样,Amazon Echo把Amazon app的一部分拿出来,当你在洗衣服(发现没洗衣液)的时候把它放在你身边。这样一来就改变了上下文的环境,同时也改变了(使用)摩擦。你可以把手上的衣服放下,然后掏出手机,点击Amazon app然后查找Tide(汰渍)洗衣液,但这样你就是在替计算机干活了——你经历了一堆跟你需求无关的中间步骤。而使用Alexa的话,实际上你就拥有了直达所需任务的深度链接,在不遇到任何阻力或无需任何附加作业的情况下就把想干的事情干完了。
接下来,我们还会免除或者改变如何使用电力开关、按钮和电池的方式,这些会再次消除使用的阻力。Echo或者Google Home不需要你开和关,AirPods、ChromeCase或者Apple Watch也不需要。这些设备大都没有电源开关,哪怕有你也很少用到。你不需要做任何事情就能唤醒它们。它们一直就在那里,听候你的差遣。你说“Hello Google”,或者你朝Apple Watch望过去,或者戴上AirPods耳机就行了,就这样。你用不着告诉它们你需要它们。(这部分属于“环境计算”,但是不能很好地捕捉手表或者耳机)
与此同时,对于那些的确还有电池的设备来说,充电感觉也颇不一样了。我们从带大电池可持续数小时最好情况下可撑一天但是充电也需要可观时间的设备,转移到只需很小容量的电池充电可以很快并且可以撑很久(数天或数周)的设备。这种使用/充电时间比是不一样的。即便是被嘲讽为“需要充电的手表”的Apple Watch,现在正常使用下撑2天也是没有问题的,实际上这意味着什么呢?意味着要是晚上脱下来的话,你根本就不会考虑过电池的问题。再一次地,这一切都与减少使用阻力,或者说减少心理负担有关。你不用考虑线缆和电量管理、开关和启动的问题——不用做计算机所有这些的日常管理了(这也是用iPad而不是笔记本电脑的理由之一)。
这个的一个挺好的极端例子是苹果的AirPods,其使用阻力与其说是被排除不如说是被转移了。你可以抱怨说自己的耳机需要充电,但是换过来你也得承认,每次听东西的时候你可以不用插入插孔(同时一边抱怨乱作一团的耳机线解不开)了,只用戴上耳机,那30个小时的续航能力足以让你应付1、2个星期。现在你每个月只用摆弄线缆并充电2次,而不是每次用的时候都要弄。苹果希望这样能够减少使用阻力(参见: iPhone 7内幕:苹果为什么要取消耳机插孔? )——结果如何还有待观察,但情况肯定是不一样的。
所有这些小设备都有一个共同线索,那就是 取消管理,或者说使用阻力,或者说事务性工作的尝试 。这条线索把Apple Watch、ChromeCast、Amazon Echo和Google Home、Snapchat的Spectacles以及AirPods,甚至包括苹果的Apple Pencil都联系到了一起。它们试图减少过去你在使用计算机、数字设备或服务之前需要进行的事务性工作——充电、打开开关、重启、唤醒、插入、选择app等。智能手机的界面减少了软件的使用管理(比如文件管理、设置等),但是在如何管理硬件本身改变的东西更多。这是直接操作和交互方面的一个转变——在你和你想要的东西之间的按钮,这个按钮没有以前那么抽象了。它们不会询问你那些只有对计算机有意义的问题(“你现在要唤醒我吗?我充够电了没有呀?”)。这些设备对于任务来说是透明的了。
当然,问题也可以成为阻力,但它们也可以成为选择。如果说它不仅仅是一个麦克风,还是云服务的端点的话,那也只是Google或者Amazon云服务的端点(而且要是我告诉Alexa“买肥皂粉”的话,它会给我买什么品牌呢?又为什么要买这个品牌呢?)。如果说GoPro只是一个照相机而Snapchat的眼镜是Snapchat的端点的话,它们也仅仅适用Snapchat而已。作为平台,Alexa或者Google Home看起来有点像带运营商底板或者分线盒的功能手机,是 封装的补贴设备,提供集中化的服务 (Amaozn可能希望免费或者以近乎免费的价格提供给Prime客户)。你对语音助手的选择在选择购买Echo还是Home时就已经做出了,而不是事后(假设你不会两个都买,并且假设它们不会在你的厨房互相吵架)。
是的,这意味着这跟减少阻力有关, 但这也跟云和web服务公司的覆盖范围有关;跟他们如何考虑一个更广阔的世界有关,在这个世界里,PC上的web户日益被抛到身后,而智能手机OS才是平台,这个平台往常被自己的竞争对手控制;以及跟如何在其他地方建立服务有关,这个服务应该不一定就要适应别人制定的智能手机API模型。这里面有大公司由于有战略性需求而推进的因素,这个因素至少跟消费者主动拉取一样多。Google Home是Google Assistant的端点,但Allo消息应用、Android手表或者Android手机同样也是它的端点。Facebook现在还没有尝试做设备(除了Oculus,这属于另一种非常不同的对话,以及很久以前的一个功能手机合作关系),但就像Google一样,Facebook也一直在围绕着什么是app以外合适的运行时或者接触点做文章,Messenger Bot平台就是这方面最近的努力。
这里最后要思考的一件事是,有多少这样的设备是受到某种形式的AI驱动的。这方面最明显的表现就是语音助手,除了麦克风和扬声器以外不需要其他UI,所以理论上来说它们是完全透明的。但实际上既然我们并没有HAL 9000——没有通用的、人类水平的AI——语音助手有时候给人的感觉就更像是IVR(交互式语音应答),或者命令行——你只能问特定东西,至于这个东西是什么又没有明确指示。所以这方面的心理负担有可能会更高而不是更低。苹果搞Siri就错在这里——在Siri不能回答的时候导致大家以为Siri能回答任何东西。相反,我认为Amazon Alexa的成功部分要归功于它跟大家沟通清楚了自己的回答范围有多狭窄。于是悖论就出来了——语音看起来像是终极的、没有限制的、通用目的的UI但实际上只有限制领域范围的时候才见效。当然,这会变得更好,此外,我们也不应该认为声音和语音就是唯一基于AI的UI了——比方说,我们还没有尝试过看看这样一种设备类型模式可以如何应用到图像上。比如说,可以考虑把脸部识别引擎(或者语音/语言引擎)嵌入到体积小又非常便宜的设备(而且数据永远不离开设备)上的话可能就特别有趣了。这样报警传感器可以是人传感器而不是红外传感器,这种传感器只需要发出二进制的“是否有人”的信号。它可以由电池驱动,持续用上好几年。
当然,Amazon已经在销售一种小型的、电池驱动的传感器,也仅发送非常简单的信号——Amazon Dash按钮就是。洗衣房放什么进去更方便呢?是Echo还是Dash?这里有一个非常简洁的对比——这些设备 要么很聪明要么很笨 。它们代表的要么是尖端的AI研究成果(也许是本地部署,也许是作为端点连接到云),要么就是尽可能简单的设备,有时候可能是二者兼而有之,并且都可以让你买更多的汰渍。