小冰、Siri、腾讯小鲸、出门问问、科大讯飞、度秘……哪家语音语义技术牛?
从1945年到2015年,以人工智能为题讲述了许多很美的故事,模仿游戏便是其实之一。但春冬轮回,在人工智能的世界里,人们的幻想像一个小球一样,被抛得高高,也注定摔得惨惨(1974与1987年两次人工智能寒冬)。
这一次,人们对人工智能的幻想被扔得更高了。强人工智能、机器毁灭人类的说法时常有。但这更像是预言家的说法,像阴谋论。目前的人工智能还是基于逻辑与数据、没有直觉,对情感的理解与创造力更是无从谈起。
球被抛得高就一定会落得惨,甚至摔得粉碎。不过,做工程的人更谨慎些,要给这个球栓上一根绳子。这根绳子就是“从实际应用出发、从用户角度考虑”。
语音语义的现状可以大致描绘人工智能在工程界的应用情况。有自主语音语义相关技术且可以在国内使用其服务的几家公司有: 出门问问 、 科大讯飞 、 云知声 、 思必驰 、 百度 (度秘)、 腾讯 ( 腾讯 小鲸)以及Google(Google Now)、微软(小冰、小娜Cortana)、苹果(Siri)。
到底哪家的语音语义技术牛?
微软小冰属于聊 天机 器人,主打人机对话,每周例常解锁一种玩法。但微软小冰不能提供太多的实质性的服务,比如查询机票、查询车票、叫车,这些 出门问问 却能做到。
如何客观的评价技术的优劣?在这 个信 息交流特别频繁的时代,被使用的人工智能算法大都来自学术界的公开成果,很难有一家公司拥有不属于这个时代的技术。就从语音识别的角度上讲,各个公司的识别率大都在90%以上(这个问题实际上要复杂些,比如方言识别率、生僻词识别率等就有更多说法了)。当一家公司的技术只比另一家的好5%或者1%,用户便很难感受到优劣,技术被应用的场景便成了重要的不同之处。
人工智能语音语义系统的基本实现方法
这些公司的语音语义技术都和“云”离不开关系。人工智能系统按照一套逻辑推理程序,在海量的数据中寻找其认为最正确的答案。这就意味着,被使用的人工智能系统其覆盖的领域越广,就越是对数据以及运算能力饥渴。小型离线设备,如手机、家用电脑都无法满足这样的需求。解决办法是搭建一个拥有超强处理能力以及海量数据的“计算机集群”,并将其接入网络,也就是我们所说的“云”。搭建了AI语音语义系统的云就是AI语音语义云,是这些AI公司的基础设施。
搭建了智能云之后,还需要合适的语音输入端口。这个端口可以来自公众号、APP这类软件,也可以来自音箱、可穿戴智能手表这类硬件。
如何正确看待目前市面上知名的语音语义系统?
虽然人工智能系统的概念很广,具体到语音语义的概念还是很广,因此这么多类似但不同的人工智能公司在不 同方 向上深耕。从用户角度看,这些产品的不同之处还蛮大。
擅长搜索查询消息的个人助理的有腾讯小鲸和出门问问
1、腾讯小鲸目前公开的信息较少,主要被嵌入TOS系统。与Ticwear类似,TOS系统被搭载在智能手表当中。不过,小鲸的功能与其他语音助手类似,可以设置闹钟、查询信息,但不能像出门问问那样直接叫车、订咖啡。
有资料显示,曾在GoogleBrain工作过的工程师创立了名为 Scale dInference的公司,该公司的种子轮投资者就包括腾讯首席探索官David Wallerstein和腾讯本身。另外,也有消息称,腾讯没有停止其他视觉识别产品的研发。
这有点像微信当年的研发。
2、出门问问主要做2C(面向消费者)硬件产品,其智能手表Ticwatch是国内销量较高的一款全交互智能手表。出门问问的人工智能语交互技术自成体系,包含语音识别、语音合成(TTS)、语义理解、垂直搜索、智能推送5个部分。其最大的特点是可以语音呼唤本地化生活服务,导航、看新闻、查天气等都可以通过手机APP或者手表实现。
最近,出门问问推出了内测版的“魔法小问”,要把人工智能从查询信息——如“今天有什么电影”——提升到提供完整服务,如直接帮助用户订电影票。这一点是其他智能系统做不到的。
擅长连续对话的“聊 天机 器人”有图灵机器人和度秘
3、图灵机器人主要做2B业务,其语音语义系统与小冰很相似,是连续对话机器人。图灵可以被嵌入微信公众号、APP、网站或者智能硬件,用户可以让它讲笑话、做游戏,也可以用它查快递、查新闻。最近图灵机器人接受了 奥飞动漫 的投资,走智能儿童玩具的路。
4、度秘是 百度 推出的一款与小冰类似的连续对话机器人。另外,用户可以在对话的同时,查询“图灵是谁”这样的信息——这借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的实体机器人”小度“。