盘点:那些还在拼命探索的语音识别软件们

猎云网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
首图

猎云网12月03日(文/默斯良)

随着应用需求的不断扩大,以及语音技术厂商和IT巨头的大力推动,智能语音技术在移动互联网、呼叫中心、智能家居、汽车电子等领域的应用逐步深入,带动着智能语音产业规模的持续快速增长。

就目前来说,智能语音暂时还是主要在手机领域发展,只要在这一基础的终端领域做出突破性进展,智能语音软件就能更好的移植于其他的智能家居产品上。所以,目前智能语音系统还只是在手机领域有一片天。下面是目前市场上最流行的几大语音软件。

 

讯飞输入法

根据最新的市场报告,我国语音智能市场正在逐渐由寡头垄断走向垄断竞争格局,但是科大讯飞仍然以54.2%的市场份额独占鳌头。科大讯飞的招牌产品讯飞输入法作为全球首款根据云核算技术完成的智能语音输入法,其不仅支持英语和粤语输入同时将语音、手写、拼音、笔画输入集于一体。

讯飞

输入时无需切换即可在拼音输入界面进行手写和语音输入,大大提升发短信、写微博、聊QQ、输网址的速度。其三种语言的高识别率,以及各种输入模式之间的完美结合让讯飞输入法具有超强的竞争力。

新版讯飞输入法推出了“0流量飞传”功能,以保证用户在更换手机时,能够将旧手机上的常用离线语音包转换到新手机中,提高用户粘度。

 

灵犀语音助手

灵犀语音助手是科大讯飞跟中国移动合作进行市场试探的智能语音助手。跟电信运营商深入合作的好处就是不仅可以提供语音控制打电话、发短信、查天气、设置提醒功能,还整合了语音搜索查话费、查流量、买彩票、订购彩铃这些直达功能。

灵犀

灵犀语音助手最新的动作是推出了“读你妹”“方言播报”休闲语音功能游戏,休闲之余还可以锻炼口音,想以游戏学习娱乐的方式来黏住用户。

 

百度语音助手

依据百度搜索这一强大平台,百度经过长期技术积累推出了百度语音助手这款支持语音指令、语音搜索、语音对话功能的智能语音服务软件。采用了深度神经网络技术(DNN),使得语音相对识别错误率降低了25%,更加精准。

百度语音助手

百度语音助手也逃脱不了语音识别使用场景局限的问题,正试图利用手机摄像头做出突破,将语音和视觉交互整合做出新的产品。

 

 

云知声

在2012年9月29日成立的云知声作为国内继科大讯飞之后的第二家语音云公司。起初靠与搜狗语音助手的完美合作一炮打红,其特色在于支持大词汇量持续语音,支持应用通过API直接调用公有云服务。

在云计算平台下,借助区分度训练、自适应训练、大规模网络动态解码等技术和大规模语料支持,准确率高达90%,让全世界为之瞩目。另外其向微信用户推出微信语音输入插件,通过语音在微信中直接快速输入文字,官方介绍每分钟输入100字。

云知声

同时云知声还成为了阿里的YUNOS语音操控解决方案的合作商。云知声为 YunOS3.0深度定制的语音助手,实现了语音操控、语音搜索、淘宝购物等特色功能。

云知声的最新动作是推出了带有自家语音识别搜索框架的可穿戴ROM,猎云网对此也进行了 相关的报道评论 。目前云知声的策略是通过toB的深入合作,一步步试探市场、积累经验,从而获得更多资源。

 

Siri

Siri作为苹果内置智能语音软件,依托苹果平台发展非常迅速,作为一款较为成功的语音软件,siri更类似一个虚拟智能助手。通过Siri,用户可以设置提醒、发送短信或安排日程。

Siri

 

搜索只是Siri的一部分,而Siri的搜索非常依赖“知识搜索引擎”Wolfram Alpha这种垂直搜索工具。后者的搜索服务能回答一些古怪的问题,例如“希腊的GDP是多少”,但并不擅长处理日常的关键词搜索,它的亮点就是人机的互动方面,不仅有十分生动的对话接口,其针对用户询问所给予精准的回答,有时候更是让人有种会心一笑的惊喜,甚至如果用户说出一些根本不符合语法的短词,Siris都会大概判断你的意图,并提出相关建议。

在支持的语言领域,Siris更是精通英语、中文、法语、德语、日文、意大利文、西班牙文等多种语言,甚至可以区分出粤语和中国台湾地区语言,真正做到了智能识别,当然在一些具体语种上难以做到最好。

其突出优势还在于与ios系统的紧密的整合,目前状态下Siris已经常驻系统后台并且可以接管一些重要的系统功能了。

 

Google Now

根植于Google自己强大的搜索及周边技术,Google Now可以说是目前最好的语音助手方案。

谷歌

Google Now解决了Siri的缺陷,在各个方面都表现得更好。Google Now展示了在移动设备中的各种垂直搜索服务。相比于Siri,Google在搜索方面明显做的更好,今年3月24日, Google Now语音服务正式登陆Windows和Mac桌面版Chrome浏览器,现在用户不仅可以在Android手机使用Google Now语音服务,也可在台式机和笔记本电脑上通过谷歌Chrome浏览器使用这一服务了。

但同样,Google无法解决使用场景的问题。但优秀整合的技术能为基于Android Wear的可穿戴设备提供良好的功能体验。

 

微软Cortana

“Cortana”(科塔娜)这个名字我相信《光环》爱好者都不会陌生,是的这个名字来自于微软Xbox的超大作游戏《光环》,在游戏中是一个人工智能电脑(AI),就像所有科幻电影和游戏中那样,它聪明、强大,使用这个名称来命名手机助手应用,可以看出微软对其寄予的厚望。

cortana

基于这种设计理念,Cortana与Siri、Google Now以及其他语音软件最大的不同就在于它拥有一个虚拟的“记事本”。这个记事本并非是隐私收集器,而是代表Cortana记录了你的一切待办事项。所以它并不会给你带来“窥探”的感觉,而是一种完全可控的透明机制。

Cortana的应用体验也与其竞争对手有所不同。举个例子,当你对它说“提醒我下次打电话给我妻子,我们需要讨论一下关于凯文的问题”,当你下次给妻子打电话时,Cortana就会提醒你别忘了说凯文的事,这种体验是十分超前的。

 

由于智能语音技术技术要求高,竞争壁垒大,随着智能终端的广泛普及,语音交互需求不断提升,语音技术和产品将由后装不断向前装发展,并逐渐向芯片集成方向过渡,如果不重视发展的话,很有可能就会被踢出智能语音这块大蛋糕的市场。

由于智能语音的搜索直达特性,在使用习惯成型之后会对更多垂直O2O行业产生深入影响。要知道搜索这种入口产品,在行业里有着极强的控制力。

另外,智能家居将是下一个发力方向,有望为智能语音带来新的市场增长点,所以说,智能语音这块大蛋糕正在疯狂吸引着各大厂商努力开发。

互联网化已经成为常态,在市场化过程中只能语音在不断转型发展。根据“智慧语音联盟”提出的全球首页智能语音“5A标准”的要求,未来的智能语音解决方案要具有个性化语音体验(Anyone)、智能全操控(Anyhow)、全天候操作(Anytime)、千万级数据本地存储(Anything)以及全环境使用(Anywhere)五大特征。在可穿戴设备爆发前夜,这一技术值得持续关注。

随意打赏

提交建议
微信扫一扫,分享给好友吧。