嘿 Siri,聊聊你的前世今生
当人们还在抱怨 Siri 反应迟钝和硬核回复的时候,一场来自 苹果 内部的变化正在发生 ——Siri 三位创始人的最后一位 Tom Gruber 近日宣布退休,与此同时苹果搜索业务的主管 Vipul Ved Prakash 也离开了苹果。 时间往前稍微拨动一下,还可以看到苹果最近着手整合了 Siri 和 ML 团队并任命了新主管 John Giannandrea。
伴随着 Tom Gruber 的离开,ML 和 Siri 团队的整合,Siri 这个承载着苹果人工智能梦想的服务也彻底打上了苹果的烙印。
而发生着的这一切都毫无掩饰的向外界传达出苹果终于要在 Siri 上发力了 ———— 不再是随 iPhone 4s 推出的注脚,更不再是影响苹果生态的掣肘。
苹果的人工智能梦与 Siri 的起源
由于健康状况恶化,Siri 是史蒂夫 · 乔布斯在苹果公司的最后时光里积极参与的项目之一。
然而,智能语音助手的起源可追溯到乔布斯离开公司后的 20 世纪 80 年代苹果研发计划。
在 20 世纪 80 年代后半期,当时的苹果首席执行官约翰 · 斯卡利委托星球大战导演乔治 · 卢卡斯为他所谓的「知识导航器」制作概念视频。
该视频以卓越的先见之明,向人们展示出了智能助手的未来,并且在今后一一变为现实。
视频中一位大学教授使用着类似 iPad 的设备,屏幕中出现的一个打着蝴蝶结的助手提醒着他,「今天你 12 点有一份教员午餐 ; 你需要在下午 2 点之前把凯茜带到机场 ; 你在下午 4 点 15 分就亚马逊热带雨林的森林砍伐进行演讲。」
但在当时,这项技术还没有做好拥抱新世界的准备。一直到 2003 年,国防部下属的 投资 部门先进科研项目局(DARPA)找到了一家非盈利的研究机构 SRI International,委托他们领导一项长达 5 年、500 多人参与打造的一个虚拟助理项目,美国政府希望利用其研究成果来帮助军队的指挥官处理大量的战场信息和日常事务。虽然 Siri 并不是这一项目的直接成果,但这个叫做「可学习与组织的认知助理」(CALO)的人工智能助理,最终为 Siri 的开发提供了灵感与模型。
就这样,在国防部 1.5 亿美元的资金支持下,上百名人工智能领域的顶尖专家展开了一次雄心勃勃,但又前途未卜的探索:教计算机如何在自然环境中学习,而这也成为了当时「史上规模最大的人工智能项目」。
而 Siri 的创始人之一亚当 · 奇耶(Adam Cheyer)也正是这个项目中的一员。在 SRI,奇耶的任务是将 CALO 项目下 27 支团队建造出的不同组件组合成一个完整的助理。每年这个虚拟助理都要接受一次测试,来检验它在这一年的时间中都学到了什么。奇耶打造的这款「研究用虚拟助理」(名字也是 CALO)十分简陋,离消费者的电脑与 手机 还有很远的距离。但 CALO 已经可以完成许多原来只能由人类完成的任务了。
这段时间,奇耶一边训练 CALO,一边在 SRI 的先驱者计划中帮忙。先驱者计划于 2003 年和 CALO 项目同时启动,目标是帮助德国电信和摩托罗拉等公司探索智能手机的发展前景。先驱者计划中的科研人员也开发了他们自己的虚拟助理原型。这个助理虽然没有 CALO 那么神通广大,但可行性更高。
这个开发中的原型助理引起了摩托罗拉公司一位经理,同时也是 Siri 三位创始人之一的戴格 · 吉特劳斯(Dag Kittlaus)浓厚的兴趣,后来他从摩托罗拉公司离职并加入 SRI。加入 SRI 后不久,吉特劳斯和奇耶以及 SRI 的另外几位同事便开始讨论如何将 CALO 和先驱者两个项目的精髓合并在一起,并开办一家公司把它发扬光大 ————Siri 的故事便由此开始。
(图片来源:HuffPost)
独立应用 Siri 与苹果 Siri
十多年后的 2007 年秋天,智能助理软件等待已久的机会终于到来了。更高速的无线网络、更准确的语音识别、云计算的快速发展和各种全新的网络服务,这些都让智能助理成为了可能。
与此同时,在这个秋天苹果发布了初代 iPhone 这款革命性的产品,加之前面的技术铺垫,都让吉特劳斯和他的伙伴们意识到在这块小小的屏幕上,除了可以进行图形交互,还可以加入「智能助手」进行语音交互,这个助理可以帮助用户完成各种各样的工作,同时也免除了在狭小的触摸屏上点来点去和等待网页加载完成的痛苦。
此外吉特劳斯和他的伙伴们还有另一个很重要的优势:他们可以使用 CALO 项目开发出的技术。根据 1980 年国会通过的一项法案,像 SRI 这样的非盈利机构有权从政府资助的软件项目中获得收益。这项法案还允许 创业 公司用股权与 SRI 换取 CALO 项目核心技术的使用权。
虽然奇耶对能否将 CALO 项目转化成有利可图的生意还持有怀疑态度,但吉特劳斯还是成功地劝说他辞去了他在 SRI 的工作,一起成立了这家叫做 Siri 的公司。吉特劳斯在新公司中担任 CEO,格鲁伯担任技术主管,奇耶则是负责工程开发的副总裁。
(图片来源:HuffPost)
2008 年初,Siri 公司拿到了 850 万美元的投资,而他们随后几个月里的进展都有「重大突破」。
几位创始人将他们的 Siri 原型软件放在他们自己设计开发的人工智能系统里面,教它如何理解和回答用户的提问。当用户向 Siri 提出一个问题,Siri 会将用户的语音信息传送到数据中心的服务器。这些服务器上的语音识别软件可以将语音信息「转录」成文字信息。
接着,Siri 要搞清楚这些文字的含义 —— 这一过程被计算机科学家们称为自然语言处理。因为人们可以用许多种不同的方式来表达同一个意思,而机器则需要更加精巧和灵活的算法才能理解,而这也恰恰成为了日后「智能助手」技术方面最大障碍。
一开始,开发者们没有给 Siri 的功能添加任何限制。他们构想中的 Siri 可以连接到任何网络服务。但他们也知道想让 Siri 成功,这个虚拟助理不仅要聪明,还要风趣。
所以在 2010 年,可以看到 Siri 首次作为 iPhone 的第三方应用亮相,并在之后发布会中回答苹果高管「你是谁」时,屏幕上出现了「我是一位谦逊的私人助理」的巧妙回复逗笑了现场的观众们。
(图片来源:HuffPost)
你还可以看到 Siri 对流行文化有着些许了解,还有点「冷幽默」。如果你向它打听那里有健身房,Siri 会回复你:「没错,你手机握得的确不太紧」,甚至 Siri 厌烦你的提问时,偶尔还会在屏幕上蹦出「Fuck」这样的词语。
同时,Siri 在上线之初支持 Android、BlackBerry OS 等平台使用,它还可以与 42 个网络服务相连接 —— 从餐馆点评网站 Yelp、售票网站 StubHub,到电影点评网站 Rotten Tomatoes 和数学计算网站 Wolfram Alpha—— 然后 Siri 会将各个网站上的信息整合在一起再回馈给用户。无需打开其他的应用软件,Siri 就可以帮助用户买票、订餐馆或叫出租车。它几乎可以感觉到用户的好恶,按照用户的个性提供相应的建议。
在开发者的构想中,Siri 不再是搜索引擎的附属品,而是把目标瞄向了「人工智能」,这一点也在多年后汤姆 · 格鲁伯(Tom Gruber)的 TED 演讲中得到证实。
他们希望 Siri 可以聆听用户的要求,然后给出相应的反馈。当你在酒吧里喝高了的时候,用谷歌搜索找车送你回家并不是件容易事;但 Siri 则可以理解你口中含糊的 「我喝高了 …… 回家 ……」,然后帮你叫车。
在他们的设想里,人工智能系统可以主动提供用户需要的答案,而不仅仅是找到相关的链接让用户自己做出选择。如果说搜索引擎定义了第二个网络时代,Siri 的创始人则相信任务引擎将开创第三个网络时代。
就当 Siri 向人们抖着「机灵」展示其服务的时候,吉特劳斯接到了来自乔布斯的电话。
第二天 Siri 创始人与乔布斯见了面,彼此探讨了「智能助手」的未来,并且后者一直对使用语音识别技术为 iPhone 打造一个语音交互界面很感兴趣。在此之后苹果对这家创业公司产生了强烈的收购意向。
当然对 Siri 感兴趣的并不止苹果公司一家,2009 年秋天,比苹果早了几个月,Verizon 也与 Siri 签署了一项授权协议,意图为之后推出的 Android 手机全部预装 Siri 应用,并且拍好了宣传广告,但是苹果的收购让这一计划惨遭「流产」。
2010 年 4 月苹果以接近 2 亿美元的价格收购了 Siri,并在其他平台下架了 Siri 应用,而伴随着这个由 24 人所组成的团队入驻苹果公司总部,其也开始了对 Siri 大刀阔斧式的整合。
收购 Siri 后,苹果纠正了它的一些坏毛病,在赋予它一些新能力的同时,也大大限制了其他的功能。包括用语音直接回复用户提问,而在此之前,它只能提供文字反馈。同时赋予了 Siri 更多的语言,使它可以在多个国家为上百万(当时的苹果用户数)使用。它还与 iOS 系统深度整合在一起,可以调用十几个 iOS 内置工具来完成像安排会议、回复邮件和查看天气这样的简单任务。
而这些功能在苹果收购 Siri 公司 16 个月后的 2011 年 10 月 14,随着 iPhone 4s 一同问世,这也成为有史以来第一款深植系统内部的「智能助手」。不过,2010 年 Siri 应用发布时的主要功能之一的餐馆预订等功能,直到 2012 年才重新与 iPhone 用户见面。
苹果 Siri 的危机与未来
Siri 的出现为苹果的生态又增添的几分活力,但在这背后似乎还蕴藏着更多的危机。
Siri 发布不久乔布斯逝世,使得苹果的智能语音助手规划暂时停滞,在此后的一年,苹果聘请前亚马逊搜索主管比尔 · 斯塔西奥(Bill Stasior)领导 Siri 业务,外界则认为斯塔西奥的专长是搜索,而不是语音交互,Siri 团队的一些成员认为他并没有完全理解产品的原始愿景 ——— 从 iPhone 拓展到更多的第三方应用,从而使得 Siri 的发展偏离正轨。在此期间 Siri 创始人吉特劳斯和奇耶都相继离职,尽管俩人离职的原因一直是个谜,但外界猜测与此事存在一定的关系。
另外,Siri 问世之后一直都面临着语音识别能力不强的窘境,经常因环境声和说话人的口音出现识别错误。同时竞争对手的智能语音助手也陆续上线抢占市场,包括早期的谷歌 Google Now、三星 S-Voice、微软 Cortana 等,待到后来迎着 AI 的春风走来的亚马逊 Alexa、谷歌 Google Assistant 等助手以更加精准的识别和更好的体验使得 Siri 面对的形式更加严峻。
苹果对 Siri 的重视一直都「在线」,一边将 Siri 纳入越来越多的平台 iPad、Apple Watch、HomePod 以及 Apple TV 等,而另一边又顶着用户对 Siri 的不满和来自行业的压力。
外媒称,制约 Siri 不够智能的原因可能是苹果公司十分在意对用户隐私的保护,Siri 与亚马逊和谷歌不同的是它不直接利用设备内的数据来连接云端进行服务,这也成为 Siri 无法更智能的原因之一。而这也恰恰解释了在 2017-2018 年硅谷大规模爆出用户隐私被泄漏,而苹果则能独善其身。
伴随着近期 Siri 部门职位的扩招以及本次 Siri 和 ML 部门的整合,相信苹果能在用户隐私和 Siri 之间平衡出更好的办法,让 Siri 更加智能。
【来源:数字尾巴】