Wit.ai:让任意应用都能集成自然语言交互界面

TechCrunch  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

去年,语音技术巨头Nuance 悄悄地收购了VirtuOz ,后者是用于网络销售、营销和支持的虚拟助手的开发商,客户包括PayPal和AT&T。现在,VirtuOz的创始人兼CEO Alexandre Lebrun又重返创业界,推出了 Wit.ai 。该平台提供的API可以让开发者在任意应用或硬件中集成语音识别技术和自然语言交互界面。

用Lebrun的话说,Wit.ai要在语音界面领域采取“Twilio或Stripe模式”,除了语音识别外,Wit还能理解用户的意图。

想要在应用中集成Wit的开发者只需插入少量代码;有史以来第一次,开发者们不必成为这一领域的专家,也无需承担使用语音识别技术的高昂成本,就能使用语音识别服务。

为了和创业公司英雄Twilio和Stripe保持一致,Lebrun及其联合创始人Willy Blandin申请并加入了本期Y-Combinator创业班。此外,Wit.ai也取得了一些惊人的进步。

在开放测试的两个月中,其服务通过口碑营销就获得了2000名开发者用户;还与一些大客户达成了协议,包括一家大设备制造商、一家汽车公司、一个电视频道和多家家居自动化创业公司。Lebrun和他的小团队目前正在智能手表制造商Pebble的帕洛阿尔托办公室外办公。

Lebrun表示,推出Wit.ai是基于两点理由。

首先,现在还没有基于API的自然语言平台。 这是因为涉及自然语音的平台要开发通用应用很困难。这意味着大部分应用想要采用语音界面都需要花费大量成本和时间,这一代价对于大多数应用开发商而言都过于高昂。

在Lebrun运营VirtuOz时,开发者的这一需求和满足这一需求所面临的挑战是Lebrun经常遇到的事情。

“如果有人要求我们开发一个智能助手,通常要花10万美元和三个月时间”,他说道:“这对技术的要求很高。你必须考虑语法、特定术语和不同的用例。”

然而,对于新一代设备而言,自然语言将成为最自然的交互方式。

“史蒂夫·乔布斯在iPhone中加入了Siri,但这一功能绝对必要吗?大部分人都不喜欢它,因为它不能做很多超出手机功能之外的事情”,他说道。

相反,Lebrun表示,Wit.ai专注于开发者为下一代设备打造交互界面的方式,“下一代设备没有键盘。想想Nest或谷歌眼镜以及其他许多可穿戴设备。除了语音外没有其他选择。”

创办Wit.ai的第二个原因与更宽泛的创新问题有关。Lebrun曾经在一家大型语音技术公司呆过,为什么不在那里设立Wit.ai项目呢?

他表示,除了大企业抗拒可能损害现有收入的技术的事实外,他觉得存在时间长的大企业要孵化并壮大新概念很困难。

“如果你问为什么Nuance不能开发VirtuOz的技术,我会说,为什么AT&T没法创造Twilio?Wit.ai必须成为局外人”,Lebrun解释道。

当然,Wit.ai并不孤独:市面上也有其他自然语言和语音识别公司,包括 Robin Labs 、 亚马逊英特尔

Wit.ai所从事的事情在技术层面上利用了很多大数据架构的好处和优势。

Wit.ai集成了多个语言处理引擎并让它们并行运行,包括卡耐基梅隆大学的 Sphinx开源项目 。通过使用机器学习技术,Wit.ai能将结果智能地结合在一起,涵盖常用语言和专业词汇表。Lebrun称Wit.ai是“这一切之上的虚拟层”,将这些服务组织在了一起。

另外,Wit.ai中还加入了众包数据元素,在数据库中集合了开发者在应用中使用的短语命令。开发者可以选择是否加入该计划。

Wit.ai试图颠覆自然语言和语音识别多年来发展的方式。Lebrun表示:“它将成为语音和语言行业的革命。”

下面的视频介绍了Wit.ai的技术如何运作: