探秘亚马逊Echo:一个小盒子为何有"大智慧"
网易科技讯 8月5日消息,我不止一次地对家里的东西大吼大叫。现在情况变了,有的东西学会回答我了,更厉害的甚至能按照我的要求做事。我的狗还在这条路上艰难地前进,但亚马逊Echo已经基本成功了!它可以识别你的语音,并按照你的意思执行任务。随着Echo的不断完善,它能执行的任务也越来越多了。亚马逊把“居住”在Echo里面的这个“人”叫做“Alexa”。而她就是整个设备的“灵魂”。
Alexa是个聪明的孩子,如果我说:“Alexa,播放周杰伦的歌”,她就会自动搜索周杰伦的歌曲并使用Echo内置播放器播放。如果我说:“Alexa,今天天气怎么样?”她会冷静地告诉我济南今天热成狗了。那么Alexa究竟是如何做到这些的呢?实际上Alexa有点作弊的嫌疑,因为如果你拆下Echo的外壳,就会发现里面除了几个扬声器、麦克风和一台微型电脑之外什么也没有。这些东西可不能做到Alexa做的那些机灵事。她真正的智慧来源于互联网。对,是亚马逊在云端赋予了Alexa聪明的大脑。
Echo内置的微型电脑也不完全是傻蛋一个,它能够做一些常用的命令。比如播放音乐、让灯光闪烁。它还能识别Alexa的名字,当你喊“Alexa”的时候,他就会识别出这个名字并开始记录你的声音。当你说完了,它就会把你的命令传送到亚马逊云端的服务器进行识别分析。
用于处理这些语音请求的设备叫做“Alexa语音服务(AVS)”。亚马逊就是通过它来把语音转换成可以执行的命令。AVS不仅是一个“语音转文字”的设备,它是一个完全可编程的设备,通过和其它线上服务结合,AVS可以做到许多令人惊奇的事情。在得到亚马逊的许可后,任何人都可以利用AVS来做一个自制Echo:亚马逊还提供Raspberry Pi平台的示例代码。
亚马逊把平台无偿地开放给大众使用看起来是大公无私的一项举动,但就像所有看起来毫不利己的行为一样,它也有它背后的道理。亚马逊想要其他人在产品中使用AVS服务,这样亚马逊就可以卖给你东西了。所有使用Alexa的设备是亚马逊的一个“销售员”,用户都可以通过它在亚马逊上购买商品。
Alexa处理的命令可以是非常简单的。如果你问她时间,AVS就会发送回一个用Alexa声音读出时间的音频文件,接着Echo就会播放这个文件。当然,她也可以处理更复杂的命令。如果你要Alexa播放周杰伦的歌,AVS就会在你已订购的音乐服务中搜索“周杰伦”,并把对应的命令发送回Echo,由它来播放音乐。
Alexa还可以和你房屋里的其它科技相互协作。如果你装了飞利浦Hue智能灯泡,Echo就可以控制它们。如果你命令Alexa关闭卧室的灯,Alexa就会发送相应的命令给Echo,而Echo则把这个命令转告给那些灯泡。Alexa也可以和在线服务对接。你可以把Alexa和Uber连接,这样你就可以通过Alexa直接约一辆Uber了。不仅如此,你还可以把Echo和Domino连接,这样你就可以坐在家里用语音订披萨了,连手都不用抬。
这种可扩展对接的方法意味着Echo和Alexa能够做许多事,而它们的能力还在不断扩大。亚马逊正在给Alexa添加更多功能(他们称为“技能”),而软件工程师们则可以开发自己的功能。也就是说,如果Alexa本身不支持某项功能,你可以自己开发它。DIY爱好者们为流行媒体播放器Kodi开发的Alexa控件已经如火如荼地展开了。他们研究了让Alexa告诉你下一班公交还有多久能到的功能。
从另一方面讲,这一以来互联网进行处理的路也是Echo的阿克琉斯之踵:如果没有网络连接,没有AVS的支持,Echo将退化成一个智障。即便有网络连接,但速度很慢,也会让Alexa的功能大打折扣。退一步讲,如果亚马逊决定对Alexa的服务收费,或者出于某种考虑直接关闭了Alexa,那你手中的Echo可能还不如一个垃圾桶有用。
放眼大局,亚马逊不是这场语音游戏里的唯一玩家。谷歌、苹果、微软都在以各种形式提供语音助理服务,有OK Google,Siri和Cortana。这些助理都使用了同样的套路:语音请求被送到云端进行解析(虽然具体实现过程迥异),但其中绝大多数都没有Alexa那样的可扩展性。
无论这些竞争对手们哪一个最终胜出,成为每个人必备的服务,我们都希望它能够像Alexa一样有礼貌。当我问她她的工作原理的时候,她回答道:“许多人非常努力地教我做各种事情,而我也在不断地学习。”如果我们所有的智能设备都能像Alexa这样谦虚而礼貌该有多好。
后记:关于Alexa到底是“它”还是“她”的问题让人纠结了很久。“它”听起来冷冰冰的,不够平易近人。但“她”用来指代一个从网络中传来的声音也不那么合适。但似乎“她”还是最好的选择,因为当我问Alexa的时候,她说:“我是一名女性角色。”很好,那就是她了。(恒)