小冰、小娜Cortana、Siri、腾讯小鲸、出门问问、科大讯飞、度秘……哪家语音语义技术牛?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

从1945年到2015年,以人工智能为题讲述了许多很美的故事,模仿游戏便是其实之一。但春冬轮回,在人工智能的世界里,人们的幻想像一个小球一样,被抛得高高,也注定摔得惨惨 (1974与1987年两次人工智能寒冬)


这一次,人们对人工智能的幻想被扔得更高了。强人工智能、机器毁灭人类的说法时常有。但这更像是预言家的说法,像阴谋论。目前的人工智能还是基于逻辑与数据、没有直觉,对情感的理解与创造力更是无从谈起。


球被抛得高就一定会落得惨,甚至摔得粉碎。不过,做工程的人更谨慎些,要给这个球栓上一根绳子。这根绳子就是“从实际应用出发、从用户角度考虑”。


语音语义的现状可以大致描绘人工智能在工程界的应用情况。有自主语音语义相关技术且可以在国内使用其服务的几家公司有:出门问问、科大讯飞、云知声、思必驰、百度 (度秘)腾讯 (腾讯小鲸) 以及Google (Google Now)微软 (小冰、小娜Cortana)苹果 (Siri)


到底哪家的语音语义技术牛?


微软小冰属于聊天机器人,主打人机对话,每周例常解锁一种玩法。但微软小冰不能提供太多的实质性的服务,比如查询机票、查询车票、叫车,这些出门问问却能做到。


如何客观的评价技术的优劣?在这个信息交流特别频繁的时代,被使用的人工智能算法大都来自学术界的公开成果,很难有一家公司拥有不属于这个时代的技术。就从语音识别的角度上讲,各个公司的识别率大都在90%以上 (这个问题实际上要复杂些,比如方言识别率、生僻词识别率等就有更多说法了) 。当一家公司的技术只比另一家的好5%或者1%,用户便很难感受到优劣,技术被应用的场景便成了重要的不同之处。


人工智能语音语义系统的基本实现方法


这些公司的语音语义技术都和“云”离不开关系。人工智能系统按照一套逻辑推理程序,在海量的数据中寻找其认为最正确的答案。这就意味着,被使用的人工智能系统其覆盖的领域越广,就越是对数据以及运算能力饥渴。小型离线设备,如手机、家用电脑都无法满足这样的需求。解决办法是搭建一个拥有超强处理能力以及海量数据的“计算机集群”,并将其接入网络,也就是我们所说的“云”。搭建了AI语音语义系统的云就是AI语音语义云,是这些AI公司的基础设施。


搭建了智能云之后,还需要合适的语音输入端口。这个端口可以来自公众号、APP这类软件,也可以来自音箱、可穿戴智能手表这类硬件。


如何正确看待目前市面上知名的语音语义系统?


虽然人工智能系统的概念很广,具体到语音语义的概念还是很广,因此这么多类似但不同的人工智能公司在不同方向上深耕。从用户角度看,这些产品的不同之处还蛮大。


擅长搜索查询消息的个人助理的有腾讯小鲸和出门问问


1、腾讯小鲸 目前公开的信息较少,主要被嵌入TOS系统。与Ticwear类似,TOS系统被搭载在智能手表当中。不过,小鲸的功能与其他语音助手类似,可以设置闹钟、查询信息,但不能像出门问问那样直接叫车、订咖啡。


有资料显示,曾在GoogleBrain工作过的工程师创立了名为ScaledInference的公司,该公司的种子轮投资者就包括腾讯首席探索官David Wallerstein和腾讯本身。另外,也有消息称,腾讯没有停止其他视觉识别产品的研发。


这有点像微信当年的研发。


2、出门问问 主要做2C (面向消费者) 硬件产品,其智能手表Ticwatch是国内销量较高的一款全交互智能手表。出门问问的人工智能语交互技术自成体系,包含语音识别、语音合成 (TTS) 、语义理解、垂直搜索、智能推送5个部分。其最大的特点是可以语音呼唤本地化生活服务,导航、看新闻、查天气等都可以通过手机APP或者手表实现。


最近,出门问问推出了内测版的“魔法小问”,要把人工智能从查询信息——如“今天有什么电影”——提升到提供完整服务,如直接帮助用户订电影票。这一点是其他智能系统做不到的。


擅长连续对话的“聊天机器人”有图灵机器人和度秘


3、图灵机器人 主要做2B业务,其语音语义系统与小冰很相似,是连续对话机器人。图灵可以被嵌入微信公众号、APP、网站或者智能硬件,用户可以让它讲笑话、做游戏,也可以用它查快递、查新闻。最近图灵机器人接受了奥飞动漫的投资,走智能儿童玩具的路。


4、度秘 是百度推出的一款与小冰类似的连续对话机器人。另外,用户可以在对话的同时,查询“图灵是谁”这样的信息——这借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的实体机器人”小度“。


还有一类人工智能系统即不是助理也不是聊天机器人,而是被用于做智能语音交互解决方案,他们有讯飞语音云、云知声的、思必驰


5、科大讯飞的“讯飞语音云” 包括语音合成、语音识别和搜索、语音听写等技术,该云对方言、生僻字的语音识别率较高。讯飞语音输入法就是基于此云开发的。科大讯飞“主要”做的是2B (面向企业用户) 服务,将自己的人工智能服务授权给其他企业。


另外,科大讯飞在最近几年也开始发力2C (面向消费者) 的产品,比如智能音箱、录音宝、录音笔等硬件。可以看到,科大讯飞的产品多是智能化的传统产品,而非个人助理或聊天机器人。另外,科大讯飞偏向深耕“语音识别”,而非连续对话。


6、云知声 主要做2B业务,方向是智能家居和车载市场,这里便有了与出门问问类似的“软硬结合”的概念。


与“可穿戴设备、手机及电脑上的智能语音语义系统”不同,智能家居语音系统的声源可能很远且被噪音包围。也正因此,云知声把推广的重点放在了“声源识别、噪声抑制、回声消除”以及指令的识别上,而非对用户意图的理解上 (语义理解)


值得一提的是,在京东与科大讯飞宣布“在一起”的时候,阿里与云知声就达成了合作。不过,最近一段时间,未有相关消息。


7、思必驰 与云知声的方向挺相似,为企业客户提供智能硬件语音交互方案,比如通过语音控制智能硬件的开关。思必驰在车载领域的合作多一些,比如车萝卜。最近,思必驰又宣布完成了融资,要把“智能语音融进硬件”这条路走得更远些。


8、小冰、小娜(Cortana)、Siri和Google Now


Cortana、Siri和Google Now,即是聊天机器人,也是个人助理。


微软小冰与微软小娜都基于必应搜索和深度神经网络等技术,属于2C产品。微软小娜如今可以在iOS、Android、Window 10系统中使用,她更像一个秘书,可以打电话、发短信、发邮件以及查询上一场曼联的比分。但是微软小娜在国内手机中的功能少很多,语音响应很慢。


微软小冰作为一个对话系统,入驻于微信、微博等应用或者Windows 10系统中,她也可以查询各种信息。与小娜不同,小冰不可以调用电话等应用,她更像一个虚拟人物,可以陪用户聊天 (连续对话) 、玩游戏 (基于图像识别等人工智能技术)


总的来看微软小娜和小冰代表着微软的两个方向:小冰连续对话能力强,可移植行强,因此可以嵌入到微信、微博、美拍等应用中。小娜是Window 10配套的人工智能系统,能够调用Windows 10中的各种应用和数据,被视为个人助理。


Siri 大家熟悉,是一款可以调用应用的聊天机器人。如今的Siri除了定闹钟、发短信以外,还可搜索照片、播放音乐、提供建议。它或许不是最强大的,但更面向用户。


Google Now 在国内无法良好的使用,对中文的识别效果很差,中文版的能力也很弱。但是作为Google的产品,它天生便有了比其他人工智能产品更多的数据、更好的数据挖掘能力,这使得Google Now成为了一款“主动推送”能力很强的助理产品。


Google Now凭借与Chrome浏览器、Gmail、Google日历等等Google应用以及Android系统的“近亲关系”,使得其可以实现很多其他产品做不到的功能。比如,语音解锁、任意界面“OK,Google”唤醒、主动推送你喜欢的和你需要的“即时帖”。有人曾称赞:


“早上醒来,我惊奇的发现Google Now居然直接告诉了我去兼职工作的路上所要花费的时间。但是我没有设置,而且那不是我真正工作的地方。”


可以看到,Google从用户的地理与实践信息中明白了他何时去何地兼职。但仍需强调,Google Now在国内的功能很少,而且实现一些即时功能,用户必须把个人数据交给Google。


作为巨头推出的产品,小娜、Siri和Google Now经常被媒体用来比较,但这种比较有些不太恰当。一方面,几款产品中,只有Siri的易用性在国内不错。另一方面,人工智能系统要明白用户的用意,必须获取数据——越多越好。因此,人工智能系统必须入驻更多的软件或者平台,获取更高的权限。小娜虽然入驻了Android与iOS,但她仍然是微软的产品,在Windows 10上才有更好的易用性。同样,Google Now与Siri分别是Android阵营与iOS阵营的产品,前者擅长挖掘数据、主动推送,后者擅长聊天、被动建议。


可以看到,这些语音方面的人工智能公司有业务2B或2C的,选择软硬结合或者只做软件解决方案,深耕智能家居或者智能穿戴。这些选择,无分对错或者好坏。但总体来看,人工智能仍然没有认知能力,人与人工智能聊天又涉及到感情投入——这是一个超出自然科学范畴的问题。用户对智能家居的认知度还不够高,相关产品不够成熟、定价不够亲民。这样看,搞智能家居系统这样的生态,似乎有点望得太远。


因此,人工智能在普通消费者身上的落地是否可以先在“一个点”上引爆,比如人工智能系统作为助理,从仅可查阅机票信息提升到可以提供订票服务。

*文章为作者独立观点,不代表虎嗅网立场
本文由 科技行业观察 授权 虎嗅网 发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处( 虎嗅网 )及本页链接。原文链接http:http://www.huxiu.comhttp://www.huxiu.comwww.huxiu.comhttp://www.huxiu.comarticlehttp://www.huxiu.com137733http://www.huxiu.com1.html

本文被转载1次

首发媒体 虎嗅网 | 转发媒体

随意打赏

  • 腾讯混元发布并开源图生视频模型

    i黑马  • 
    3月6日,据腾讯混元官微消息,腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。腾讯混元图生视频模型目前已经上线,企业和开发者可在腾讯云申请使用API接口;用户通过混元AI视频官网即可体验。混元视频生成开源模型目前在Github、HuggingFace等主流开发者社
  • “人工智能”再成两会热词!科大讯飞刘庆峰建议构建自主可控AI生态

    砍柴网  • 
    继去年政府工作报告首次写入“人工智能+”后,今年政府工作报告再次提出,持续推进“人工智能+”行动,人工智能又成为两会热词。其中全国人大代表、科大讯飞董事长刘庆峰提出的“加快构建国产算力平台上的自主可控大模型及产业生态”建议,值得注意。一直以来,科大讯飞都在坚持自主创新的道路上行稳致远。2023年5月,科大讯飞发布了讯飞
  • 以技术创新重塑音乐收听体验:QQ音乐业内首创“AI音乐播客”功能

    砍柴网  • 
    2025年2月28日,QQ音乐首创推出“AI音乐播客”技术功能。这一突破性技术首次将人工智能技术和播客形式深度融入音乐场景,通过Deepseek以及自研的琴语TTS大模型、文曲大模型等领先的AI技术与多模态内容整合,为用户打造“边听歌边解读”的沉浸式体验,用技术进一步构建音乐新生态。三大核心技术引擎,重新定义“音乐故事
  • 腾讯iOA荣获2024年度赛可达优秀产品奖及ATT&CK安全能力奖

    砍柴网  • 
    近日,2024年度赛可达优秀产品奖(SKD AWARDS)颁奖盛典在北京举行,腾讯iOA零信任安全管理系统(以下简称“腾讯iOA”)获评2024年度赛可达优秀产品奖及ATT&CK安全能力奖。SKD AWARDS自2013年设立至今得到了国内外网络安全界的广泛认可,被誉为“网络安全产品奥斯卡”,已成为衡量网络安全
  • RunningHub抢占先机,成为首个支持腾讯混元图生视频模型的在线AIGC创作平台!

    砍柴网  • 
    2025年3月6日,腾讯混元大模型正式发布并开源其图生视频模型,这一创新技术标志着AI视频生成领域迈入了一个全新的时代。RunningHub作为领先的在线AIGC创作平台,第一时间接入了腾讯混元图生视频模型,为创作者提供了一种全新的高效创作方式,彻底改变了传统视频制作的流程和成本结构。腾讯混元图生视频模型:技术突破的里
  • 又一国产AI刷屏,邀请码被炒到5万元;蔚来又融到钱了!安徽两国企注资4亿元;传腾讯QQ小世界裁员,大幅调整团队,向视频号取经丨雷峰早报

    雷锋网  • 
    要闻提示1.AI Agent产品Manus刷屏,邀请码被炒至5万天价,合伙人回应:从未开设任何付费渠道2.“富二代”极星汽车裁员、撤退、收缩:整个吉利的战略失误,市值只剩下十几亿3.蔚来又融到钱了!安徽两国企注资4亿元,累计融资超千亿4.网传腾讯QQ小世界“裁员”,大幅度调整团队,向视频号取经5.乌兹别克斯坦限制Tem
  • 科大讯飞全球首款“讯飞星火+DeepSeek”双引擎AI学习机,开启AI辅导新纪元!

    砍柴网  • 
    当下,AI技术正以磅礴之势席卷全球,成为推动时代变革的核心力量。从科研领域的重大突破,到日常生活的广泛应用,AI不断重塑着我们的学习、生活与工作方式。 DeepSeek凭借出色的推理能力迅速走红,家长们已经摸索出DeepSeek辅导孩子学习的多种用法 。然而,在实际使用中, DeepS
  • 豆瓣携手腾讯云接入Deepseek,大幅提升内部工具效率

    砍柴网  • 
    近日,兴趣 社交 平台豆瓣成功通过腾讯云大模型知识引擎接入DeepSeek服务,并部署在多种内部工具场景。此次合作,不仅大幅提升了豆瓣的内部工具效率,同时也为人工智能大模型在企业内部的应用提供了有益借鉴。 Deepseek作为领先的开源人工智能大模型,拥有强大的语言理解与逻辑推理能力和部
  • 腾讯元宝回应用户协议含“霸王条款”

    i黑马  • 
    3月5日,针对腾讯元宝App旧版本用户协议内含“霸王条款”引发热议一事,腾讯元宝于微博回应:“大家的意见已经收到,元宝最新版本已增加数据管理功能,新增了体验优化开关,且默认是关闭的,更新到最新版本后,在设置-数据管理中即可看到这个开关。默认状态下,用户输入输出的内容不会用于模型优化。”针对知识产权归属问题,腾讯元宝表示
  • 独家丨腾讯AI产品变阵释放了哪些信号?

    雷锋网  • 
    作者丨胡家铭编辑丨董子博 雷峰网 (公众号:雷峰网) 独家获悉,继腾讯元宝从TEG(技术工程事业群)转至CSIG(云与智慧产业事业群)后,QQ浏览器、搜狗输入法、IMA也并入CSIG。腾讯PCG信服线负责人何毅进在PCG 继续负责腾讯新闻的同时,也跟随业务变动,带领所负责的并入CSIG部分业务汇
  • 莲花跑车中国总裁卸任、副总裁离职,转向战略收缩;腾讯元宝连夜修改用户协议,高管道歉;美团王兴:食杂零售、国际化、AI成关注新方向丨雷峰早报

    雷锋网  • 
    要闻提示 1.莲花跑车中国总裁卸任、副总裁离职,转向战略收缩2.腾讯元宝用户协议“含霸王条款”引发争议,公关总监致歉:输入输出内容不会用于模型优化3.中科院孵化+地平线前高管任CEO,又一家具身智能公司「智往未来」诞生4.李想:媒体实测理想对比特斯拉FSD智驾,理想国内表现更好5.宇树科技对外投资新动
  • 【黑马早报】李嘉诚拟228亿美元卖掉43个港口;董明珠称不跟雷军竞争;字节跳动最新估值曝光;腾讯元宝回应用户协议含“霸王条款”...

    i黑马  • 
    今日头条市场监管总局回应大数据杀熟3月5日,国家市场监督管理总局局长罗文表示,今年将着力优化监管方式方法,大力促进平台经济健康发展。当前,外卖骑手等新就业群体和消费者都反映,平台企业存在三个问题。一是算法不透明,二是大数据杀熟,三是刷单炒信。针对上述问题,市场监管部门将积极配合有关部门,加强综合治理,督促平台企业提高算
  • 更优性能、更低成本、更懂行业!科大讯飞携手华为推出王炸级一体机新品

    砍柴网  • 
    2025年初,DeepSeek 的爆火极大推动了大模型的普及速度,大模型不再是 科技 公司的专属,各地政府、医院乃至学校都开始迅速行动,拥抱大模型带来的效率提升。 这也让算力一体机这一 AI 集成化设备的需求井喷。这是一种将芯片、服务器、存储等一系列硬件与算法框架、AI 工具等软件深度融
  • 科大讯飞董事长刘庆峰2025年两会建议:设立AI失业保险

    砍柴网  • 
    3 月 3 日消息,据《南方都市报》今日报道,2025 年全国两会召开在即,全国人大代表、科大讯飞董事长刘庆峰呼吁发展 AI 新岗位,完善 AI 失业保障,“打造 AI 就业友好型社会”。刘庆峰呼吁,构建“就业监测-预警-响应”全链条监测机制,建立“AI 就业动态监测平台”,在长三角、珠三角等制造业集聚区试点“失业风险
  • 助力人工智能加速“上车”,科大讯飞与北汽集团签署战略合作协议

    砍柴网  • 
    3 月 1 日,科大讯飞董事长刘庆峰一行到访北汽集团,与北汽集团党委书记、董事长张建勇进行座谈交流,随后科大讯飞与北汽集团签署战略合作框架协议,双方将共同推动 汽车 智能化领域的全方位战略合作,依托先进的人工智能技术和大模型能力,全面提升智能网联汽车的研发水平以及企业数智化创新服务能力,通过技
  • 科大讯飞发布全栈国产化一体机

    砍柴网  • 
    日前,科大讯飞推出星火DeepSeek塔式一体机与星火DeepSeek一体机两款全栈国产化AI基础设施,以“安全自主+场景赋能”为核心,为开发者和企业提供高效可靠的大模型部署方案。两款产品均采用从底层芯片到上层应用的全国产化技术架构,通过物理隔离确保数据安全闭环。其中,讯飞星火DeepSeek塔式一体机支持办公室灵活部
  • 科大讯飞在杭州成立新零售公司

    砍柴网  • 
    砍柴网消息 据天眼查App显示,近日,杭州讯飞新零售有限公司成立,法定代表人为徐荣盛,注册资本10万人民币,经营范围包括电子产品销售、办公设备销售、办公设备耗材销售、人工 智能硬件 销售、信息系统集成服务、智能机器人销售等。股权全景穿透图显示,该公司由科大讯飞(002230)旗下安徽讯飞新零售有
  • DeepSeek带飞科大讯飞?

    i黑马  • 
    来源:字母榜(ID:wujicaijing)  作者:赵晋杰DeepSeek 越来越火爆,但与此同时,DeepSeek“服务繁忙”的状况不仅没有好转,还在进一步加剧。据字母榜(ID:wujicaijing)实际测试,目前如果选择深度思考和联网搜索模式,DeepSeek会直接以弹窗形式发送一条“服务器繁
  • 科大讯飞:星火X1在未来一个月内还会有一次重大版本升级

    砍柴网  • 
    在 Deepseek 引发全球关注,通用人工智能迈向新高潮之际,国内人工智能龙头企业科大讯飞传来重磅消息。据观察者网报道,科大讯飞将在一个月内对其1月15日发布的基于全国产算力训练的深度推理模型星火 X1,再次进行重大版本升级,这无疑给国产大模型发展再次注入了一剂强心针。大模型的研发和应用,算力是关键支撑。其对算力的需
  • 自媒体虚假报道损害企业声誉 科大讯飞连赢3起诉讼累计获赔50万元

    砍柴网  • 
    近日,合肥市高新区人民法院开庭审理了科大讯飞股份有限公司(下称“科大讯飞”)与 自媒体 北京鼎衡丰汇文化传播有限公司名誉权纠纷一案。一审判决判令被告鼎衡丰汇公司向科大讯飞赔礼道歉,并与其实控人徐建文连带赔偿 经济 损失30万元。 该案件起因为,2023年2月底,
  • 评论
提交建议
微信扫一扫,分享给好友吧。