Cortana 自发布起就集万千宠爱于一生,可惜只存在于 Windows 平台上。现在,越来越开放的微软主动将 Cortana 领出了“深宫”,想让其变得无处不在。
微软的方案是今年 4 月 Build 大会上公开的 Project Oxford 。Project Oxford 由微软研究院主导开发,主要为 Azure 用户免费 提供 API 服务,包括人脸识别、语音识别、图像识别和名为 LUIS(Language Understanding Intelligent Service)的语义分析。其中语音识别和 LUIS 都建立在 Bing 的语音识别和处理上,而 Cortana 正是 脱胎于 Bing 这些技术。
不久前有一个民间技术团队 OrangeSec 将硬件代理、定制 SSL 证书和域名服务器电子欺骗三样技术结合起来,大费周章才将 Cortana 移植 到了 Android 平台。现在有了 Project Oxford,开发者只需要成为 Azure 用户,就可以享用微软提供的 Cortana 同款 API,不必像 OrangeSec 团队那样耗费大力气。
语音识别 API 包含语音转文本和文本转语音两部分,LUIS 则包括语音和文本意图检测,其中 LUIS 为开发者提供了非常直观便捷、易于定制的语义分析服务:从定义模型、添加样本,到训练和主动学习,到部署 API。有开发者试用了之后形容整个过程如行云流水般顺畅。语音识别 API 可以限量免费使用,而 LUIS 则需要提交申请。
这两项服务目前支持的语言达 18 种,包括粤语、普通话和台湾话。国内开发者简单地在线上 demo 试了试中文,基本上保持了Cortana 的表现水准。
在 ArsTechnica 的 报道 中我们可以知道,Azure 提供的 API 都是模块化的,完成度很高,开发者不需要创造额外的模块。这些服务 采用的都是轻量级的 Web Service 架构风格 REST(representational state transfer,表述性状态转移),所有的 API 请求和响应都通过 HTTPS 来加密。
微软对于 Cortana 的期待值很高,未来微软全线的 Windows 家族产品都将嵌入 Cortana,包括 Xbox,且可以定制化,成为微软大平台的语音入口。据悉,未来 Cortana 将会取代 Bing 语音搜索,成为微软唯一的语音助理工具。
除了成为自家全平台的语音工具,微软还希望 Cortana 能够植入到第三方应用中。Project Oxford 中的语音识别 API 和 LUIS 让 Cortana 得以一种“润物细无声”的方式延伸开去。
题图来自 WindowsCentral
插图来自 Project Oxford