Siri对战Android语音识别:持续两周的深度测试
本文作者David Pogue,原文载于《纽约时报》。
“你的评论是我读到过的最愚蠢的东西。 我竭力不去描述你听上去多么的愚蠢,因为这简直就是对我自己的亵渎。”我在两周前发表对Google手机Moto X的评论之后便收到这封使我欢欣鼓舞的邮件。有读者对我评论中的这句“Android的语音命令仍然无法与Siri匹敌”特别不满。
伙计,我的确是个傻子。谁会傻到愿意在一场宗教战争中打出鲜明的旗帜?这样写岂不更加明哲保身:“保守党比自由党长相更好看”或“反堕胎人士和支持堕胎的人相比是更糟糕的司机。”
但是,手机的语音识别技术的优越性可不是个无聊的问题。如今触摸屏手机的大势已不可阻挡,而语音识别也因此变得极为重要。没有物理按键或按钮,输入文本和软件控制有时相当繁琐复杂。所以我决定花两个星期沉浸在语音识别的世界中:在所到之处携带iPhone和运行Android操作系统的手机,与这两款手机同时对话。我想由此来认识它们的不同,它们的优势和弱点。
人们谈论语音识别时,经常混淆三种不同的功能,即听写功能(手机转换语音到文本),命令功能(让您通过谈话实现对手机的操作)和互联网信息搜索。这三种功能在iPhone和Android手机的表现不尽相同。
听写功能在这两个系统上的表现都堪称可怜,你常常会听到人们对着他们的手机大吼“我放弃!”。 Android手机和iPhone的Siri语音功能都会发生许多转录错误。但在考虑到说话的人的口音、说话时与麦克风的距离以及环境中的噪音影响这些因素后,错误的产生就显得情有可原了。最新的Android版本并不需要网络连接来实现基本听写。并且当你说话的同时文本便会逐一显现在Android屏幕上,而Siri则是待语音完毕后转录出相应文字。另一方面,Siri能听懂“大写”、“全部大写”、“没有空格”,以及各种标点符号的语音 - “冒号”、“破折号”、“星号”、“省略号”等。 Android能听懂的只有基本的符号,如“句号”、“逗号”和“惊叹号”。
手机语音操作命令则更为成熟。这是当你说:“打电话给妈妈”,“给Emily发短信”, “7:30叫醒我”,“播放Billy Joel的歌”,“提醒我回家时喂猫”等等。在不触摸你的手机的情况下对其进行操作对安全性来说是非常重要的。说话的命令方式显然比触碰来得高级且安全。从便利程度来讲,说话肯定比在一屏幕的图标中寻找并打开“愤怒的小鸟”来得速度要快;说出“我的闹钟定为8时”比在闹钟程序中设置要快上许多。而Siri在手机语音命令方面更为前沿。当你在驾车时听到传入消息的声音,可以说,“查看我的新的消息”,Siri便可大声读取并甚至听写你的答复,全程不需要你的眼睛偏离道路。 Android暂时无法做到这一点。两个系统都可以命令自带的应用程序完成以下动作,如“周四中午与Bob Barnet开会”(日历),“记得还钱给Harold”(笔记),“发送电子邮件给Danny Cooper”(电子邮件)以及“Steve Alper的住址是什么?”(联系人)。
Android在网络搜索方面则完胜iOS,这多少归功于Google强大而迅速的搜索。两种手机都能很好地获取天气更新(“周末底特律的天气怎样?”),时间(“比利时现在几点?”),股票价格,体育信息(“下场牛仔比赛是什么时候?”),转换(“32欧元兑多少美元?”),计算(“还有几天是情人节?”)以及各类网络搜索查询(“一块Hershey巧克力有多少卡路里?”,“下一次日食是什么时候?”,“怎么拼写schadenfreude?”,“1985年雪佛莱的图片”,等等)。
Android特别惊人的是语音拨号(“呼叫34街的Macy's百货”)和查询方向(“去拉瓜迪亚机场的公共交通”),因为它的地图应用程序为此打下了坚实的基础。同时Android面对一个接一个的连串发问也更聪明。如果你的第一个问题是,“谁是希拉里•克林顿?”,你可以跟进问,“她的丈夫是谁?”
另外,Google有一个内置的类似Shazam的音乐识别功能。点击语音识别图标,让手机听任何正在播放的歌曲,即可识别歌曲和歌手。
不幸的是,Android有一个致命的弱点:要发出语音命令,你必须在Google搜索栏点击麦克风图标,且只有在主屏幕上或Google Now屏幕上(从底部向上轻扫)。所以,你无法在手机被锁定或正在使用另一个应用程序时发出命令,除了例如摩托罗拉的Moto X这样的新产品可以在任何时间进行侦听。而在iPhone上,按住Home按钮或你的耳机绳上的按键,即便在手机休眠和使用其它应用程序是也可实现语音指令功能。
Siri在餐厅和电影方面应用更全面。两款手机都能听懂 “附近好一点的印度餐馆”或“呼叫在Daleford路上的Olive Garden。”但Siri由于整合了OpenTable.com可以帮你预订,例如 “预约星期六晚上7点不那么贵的意大利餐厅。”同样,Siri提供电影类的更加综合的答案,“这周有什么新电影上映”,“《The Way, Way Back》的影评如何”,或“今天《蓝精灵2》的放映时间是什么”。Android相比只是显示Google的搜索结果。
再有就是产品个性的问题:Siri很有个性,Android则冷冰冰的。我是指关于互动中的俏皮话、笑话、态度及称呼。如果你问Siri:“谁是你爸爸?”,她会回答:“你是。我们能回去工作了吗?”问“请把我发射上太空Siri”,她答“请脱掉你的腰带、鞋子和外套,掏空你的口袋。”问“对我说脏话”,她答“腐殖质。堆肥。浮石。淤泥。砾石。”
但在苹果和Google的粉丝大战中,幽默可没有立足之地。当你夸赞Siri的个性,苹果的仇敌会这样反应:“也就是个登不了大堂的没用把戏!你听上去蠢极了好么,我只是忍住没说而已。”于是,你得被逼着在两个不同的哲学阵营中做出选择。 (虽然有Windows Phone和黑莓,但他们的语音识别比较初级。)粉丝们何不各自放下手中的剑,花点时间研究一下这两个系统呢。(这里是一个很好的Android的语音命令列表:http://j.mp/12kEFDo 这个是 Siri的:http://j.mp/16Yy4yy)
虽然Siri有自身的优势, 但差距已经大幅缩减,两个系统都在迅速提高。Android近期才添加了手机控制功能,之前只有网络搜索。今年秋季即将更新的iOS 7会使Siri获得更舒服的说话声音,更快的搜索和通过语音改变手机设置(“打开飞行模式”, “调高亮度”,“打开蓝牙”)的能力 。
我们可以明确的是:手机语音识别完善得越来越快。 也许不久,我们将不是将通过手机沟通,而是更多的和手机沟通。