Cortana,次世代的虚拟助手
本文为作者 Sean Gallagher 在 Arstechnica 网站发表的《 How Microsoft’s Cortana will take digital personal assistants to the next level 》一文,主要讲述了微软 Cortana 数字个人助手的技术细节和应用前景。
本周,微软在 Build 2014 大会上掀开了“数字个人助手”Cortana 的面纱,终于能和苹果的 Siri 以及 Google Now 有了比拼的资本。除了我们现在知道的柔和的女性声音和一些功能层次之外,Cortana 在能够回复预设的问题之外,还可以根据微软的私人数据云计算技术来回答范围更广的问题。
Cortana 是微软在投资 Bing 平台之后获得的首份回报,同时它的出现也将告诉人们大数据技术可以对信息互动、应用程序和人们周围的世界有重大范围的影响。
很明显,微软除了把 Cortana 用在 Windows Phone 上,还会用在其他产品上。在 Build 2014 大会上,微软的工作人员展示了 Cortana 助手可以用在 Bing 搜索引擎上,当然也能进入 Windows、Office 365 和 Azure 平台。苹果的 Siri 语音助手已经用上了 Bing 的搜索 API,而且鉴于 Cortana 只是一个客户端,所有的复杂处理任务都放在了微软的云计算平台上,微软可以轻易地把 Cortana 移植到 iOS 和 Android 平台上。
微软现在需要做的就是让 Cortana 学会与用户交流。根据笔者在 Build 上的体验,它现在还在学习阶段。
云端优先
在 Build 大会的展示中,Bing 产品团队的成员展示了 Cortana“云端优先、移动优先”的系统构架。Cortana 在微软搜索总监 Stefan Wietz 的口中是“根据用户意旨而演奏的交响乐”。而交响乐的演奏者们主要在云端。
不过现在的 Cortana 可以在 Windows Phone 上实现一些独特的功能。其中一个就是“记事本(Notebook)”,它可以记忆用户的偏好、兴趣、最重要的联系人、地点等信息。有些信息需要用户手动输入到记事本中或者通过其他应用来输入,记事本也可以自己从用户的电子邮件收件箱里搜索结构化的数据,比如说“约会”、“预订飞机”等。
为了不让 Cortana 太过于真实,用户可以再记事本中设置 Cortana 不能查看的内容。用户还可以设置 Cortana,让它在特定的地理位置区域内进行相关的动作,比如说进入某一区域后提醒用户“给妻子打电话”。在这里,Cortana 通过学习用户的地理位置信息来判断情况,然后为用户提供信息。
不过绝大多数 Cortana 的本地数据主要用来向用户推送信息和搜索用户的信息,剩下的任务则依靠 Bing 的云计算。
比如,Cortana 使用 Bing 的语音识别技术将语音转换成文字,然后利用 Bing 的自然语言引擎将文字转换成指令。Wietz 说 Bing 会将用户信息匿名处理并保存 30 天,用来帮助微软的工程师理解系统在分析句子时出现的错误信息,然后纠正云端的神经网络。然后 Bing 将处理后的数据还以文本的形式传回到用户手机,这样用户就算没有听到信息也能看到。
Bing 的基础构架还可以将用户的语音请求暂时存在服务器上,这样 Cortana 就可以根据之前的问题提供后续的回答。
什么都学
如果 Cortana 遇到了记事本中没有的答案,Cortana 就会使用 Bing 的知识库来进行解答。Cortana 的语义理解能力来自于 Bing 的数据库,而这一功能是微软在过去两年内一直努力打造的。
微软除了会使用自家的内容,还可以实时地获取其他来源的内容,这样微软的知识库将不断地充满知识。这样,Cortana 除了能够完成普通的语音搜索任务之外,还可以通过与已完成饭店预订等功能。
在实现了上面的功能之后,微软还将用户本地数据与网络数据进行了对比处理。Bing 团队软件构架师 Savas Parastatidis 表示,比如根据用户的数据,Cortana 可以现实用户可能会用到的航班信息(用户可以决定这个信息是否有用)。微软的服务器可以同时处理几亿次请求,然后在服务器里寻找匹配的数据。
标签: Cortana 微软 Siri Google Now