小冰、小娜Cortana、Siri、腾讯小鲸、出门问问、科大讯飞、度秘……哪家语音语义技术牛?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

从1945年到2015年,以人工智能为题讲述了许多很美的故事,模仿游戏便是其实之一。但春冬轮回,在人工智能的世界里,人们的幻想像一个小球一样,被抛得高高,也注定摔得惨惨 (1974与1987年两次人工智能寒冬)


这一次,人们对人工智能的幻想被扔得更高了。强人工智能、机器毁灭人类的说法时常有。但这更像是预言家的说法,像阴谋论。目前的人工智能还是基于逻辑与数据、没有直觉,对情感的理解与创造力更是无从谈起。


球被抛得高就一定会落得惨,甚至摔得粉碎。不过,做工程的人更谨慎些,要给这个球栓上一根绳子。这根绳子就是“从实际应用出发、从用户角度考虑”。


语音语义的现状可以大致描绘人工智能在工程界的应用情况。有自主语音语义相关技术且可以在国内使用其服务的几家公司有:出门问问、科大讯飞、云知声、思必驰、百度 (度秘)腾讯 (腾讯小鲸) 以及Google (Google Now)微软 (小冰、小娜Cortana)苹果 (Siri)


到底哪家的语音语义技术牛?


微软小冰属于聊天机器人,主打人机对话,每周例常解锁一种玩法。但微软小冰不能提供太多的实质性的服务,比如查询机票、查询车票、叫车,这些出门问问却能做到。


如何客观的评价技术的优劣?在这个信息交流特别频繁的时代,被使用的人工智能算法大都来自学术界的公开成果,很难有一家公司拥有不属于这个时代的技术。就从语音识别的角度上讲,各个公司的识别率大都在90%以上 (这个问题实际上要复杂些,比如方言识别率、生僻词识别率等就有更多说法了) 。当一家公司的技术只比另一家的好5%或者1%,用户便很难感受到优劣,技术被应用的场景便成了重要的不同之处。


人工智能语音语义系统的基本实现方法


这些公司的语音语义技术都和“云”离不开关系。人工智能系统按照一套逻辑推理程序,在海量的数据中寻找其认为最正确的答案。这就意味着,被使用的人工智能系统其覆盖的领域越广,就越是对数据以及运算能力饥渴。小型离线设备,如手机、家用电脑都无法满足这样的需求。解决办法是搭建一个拥有超强处理能力以及海量数据的“计算机集群”,并将其接入网络,也就是我们所说的“云”。搭建了AI语音语义系统的云就是AI语音语义云,是这些AI公司的基础设施。


搭建了智能云之后,还需要合适的语音输入端口。这个端口可以来自公众号、APP这类软件,也可以来自音箱、可穿戴智能手表这类硬件。


如何正确看待目前市面上知名的语音语义系统?


虽然人工智能系统的概念很广,具体到语音语义的概念还是很广,因此这么多类似但不同的人工智能公司在不同方向上深耕。从用户角度看,这些产品的不同之处还蛮大。


擅长搜索查询消息的个人助理的有腾讯小鲸和出门问问


1、腾讯小鲸 目前公开的信息较少,主要被嵌入TOS系统。与Ticwear类似,TOS系统被搭载在智能手表当中。不过,小鲸的功能与其他语音助手类似,可以设置闹钟、查询信息,但不能像出门问问那样直接叫车、订咖啡。


有资料显示,曾在GoogleBrain工作过的工程师创立了名为ScaledInference的公司,该公司的种子轮投资者就包括腾讯首席探索官David Wallerstein和腾讯本身。另外,也有消息称,腾讯没有停止其他视觉识别产品的研发。


这有点像微信当年的研发。


2、出门问问 主要做2C (面向消费者) 硬件产品,其智能手表Ticwatch是国内销量较高的一款全交互智能手表。出门问问的人工智能语交互技术自成体系,包含语音识别、语音合成 (TTS) 、语义理解、垂直搜索、智能推送5个部分。其最大的特点是可以语音呼唤本地化生活服务,导航、看新闻、查天气等都可以通过手机APP或者手表实现。


最近,出门问问推出了内测版的“魔法小问”,要把人工智能从查询信息——如“今天有什么电影”——提升到提供完整服务,如直接帮助用户订电影票。这一点是其他智能系统做不到的。


擅长连续对话的“聊天机器人”有图灵机器人和度秘


3、图灵机器人 主要做2B业务,其语音语义系统与小冰很相似,是连续对话机器人。图灵可以被嵌入微信公众号、APP、网站或者智能硬件,用户可以让它讲笑话、做游戏,也可以用它查快递、查新闻。最近图灵机器人接受了奥飞动漫的投资,走智能儿童玩具的路。


4、度秘 是百度推出的一款与小冰类似的连续对话机器人。另外,用户可以在对话的同时,查询“图灵是谁”这样的信息——这借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的实体机器人”小度“。


还有一类人工智能系统即不是助理也不是聊天机器人,而是被用于做智能语音交互解决方案,他们有讯飞语音云、云知声的、思必驰


5、科大讯飞的“讯飞语音云” 包括语音合成、语音识别和搜索、语音听写等技术,该云对方言、生僻字的语音识别率较高。讯飞语音输入法就是基于此云开发的。科大讯飞“主要”做的是2B (面向企业用户) 服务,将自己的人工智能服务授权给其他企业。


另外,科大讯飞在最近几年也开始发力2C (面向消费者) 的产品,比如智能音箱、录音宝、录音笔等硬件。可以看到,科大讯飞的产品多是智能化的传统产品,而非个人助理或聊天机器人。另外,科大讯飞偏向深耕“语音识别”,而非连续对话。


6、云知声 主要做2B业务,方向是智能家居和车载市场,这里便有了与出门问问类似的“软硬结合”的概念。


与“可穿戴设备、手机及电脑上的智能语音语义系统”不同,智能家居语音系统的声源可能很远且被噪音包围。也正因此,云知声把推广的重点放在了“声源识别、噪声抑制、回声消除”以及指令的识别上,而非对用户意图的理解上 (语义理解)


值得一提的是,在京东与科大讯飞宣布“在一起”的时候,阿里与云知声就达成了合作。不过,最近一段时间,未有相关消息。


7、思必驰 与云知声的方向挺相似,为企业客户提供智能硬件语音交互方案,比如通过语音控制智能硬件的开关。思必驰在车载领域的合作多一些,比如车萝卜。最近,思必驰又宣布完成了融资,要把“智能语音融进硬件”这条路走得更远些。


8、小冰、小娜(Cortana)、Siri和Google Now


Cortana、Siri和Google Now,即是聊天机器人,也是个人助理。


微软小冰与微软小娜都基于必应搜索和深度神经网络等技术,属于2C产品。微软小娜如今可以在iOS、Android、Window 10系统中使用,她更像一个秘书,可以打电话、发短信、发邮件以及查询上一场曼联的比分。但是微软小娜在国内手机中的功能少很多,语音响应很慢。


微软小冰作为一个对话系统,入驻于微信、微博等应用或者Windows 10系统中,她也可以查询各种信息。与小娜不同,小冰不可以调用电话等应用,她更像一个虚拟人物,可以陪用户聊天 (连续对话) 、玩游戏 (基于图像识别等人工智能技术)


总的来看微软小娜和小冰代表着微软的两个方向:小冰连续对话能力强,可移植行强,因此可以嵌入到微信、微博、美拍等应用中。小娜是Window 10配套的人工智能系统,能够调用Windows 10中的各种应用和数据,被视为个人助理。


Siri 大家熟悉,是一款可以调用应用的聊天机器人。如今的Siri除了定闹钟、发短信以外,还可搜索照片、播放音乐、提供建议。它或许不是最强大的,但更面向用户。


Google Now 在国内无法良好的使用,对中文的识别效果很差,中文版的能力也很弱。但是作为Google的产品,它天生便有了比其他人工智能产品更多的数据、更好的数据挖掘能力,这使得Google Now成为了一款“主动推送”能力很强的助理产品。


Google Now凭借与Chrome浏览器、Gmail、Google日历等等Google应用以及Android系统的“近亲关系”,使得其可以实现很多其他产品做不到的功能。比如,语音解锁、任意界面“OK,Google”唤醒、主动推送你喜欢的和你需要的“即时帖”。有人曾称赞:


“早上醒来,我惊奇的发现Google Now居然直接告诉了我去兼职工作的路上所要花费的时间。但是我没有设置,而且那不是我真正工作的地方。”


可以看到,Google从用户的地理与实践信息中明白了他何时去何地兼职。但仍需强调,Google Now在国内的功能很少,而且实现一些即时功能,用户必须把个人数据交给Google。


作为巨头推出的产品,小娜、Siri和Google Now经常被媒体用来比较,但这种比较有些不太恰当。一方面,几款产品中,只有Siri的易用性在国内不错。另一方面,人工智能系统要明白用户的用意,必须获取数据——越多越好。因此,人工智能系统必须入驻更多的软件或者平台,获取更高的权限。小娜虽然入驻了Android与iOS,但她仍然是微软的产品,在Windows 10上才有更好的易用性。同样,Google Now与Siri分别是Android阵营与iOS阵营的产品,前者擅长挖掘数据、主动推送,后者擅长聊天、被动建议。


可以看到,这些语音方面的人工智能公司有业务2B或2C的,选择软硬结合或者只做软件解决方案,深耕智能家居或者智能穿戴。这些选择,无分对错或者好坏。但总体来看,人工智能仍然没有认知能力,人与人工智能聊天又涉及到感情投入——这是一个超出自然科学范畴的问题。用户对智能家居的认知度还不够高,相关产品不够成熟、定价不够亲民。这样看,搞智能家居系统这样的生态,似乎有点望得太远。


因此,人工智能在普通消费者身上的落地是否可以先在“一个点”上引爆,比如人工智能系统作为助理,从仅可查阅机票信息提升到可以提供订票服务。

*文章为作者独立观点,不代表虎嗅网立场
本文由 科技行业观察 授权 虎嗅网 发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处( 虎嗅网 )及本页链接。原文链接http:http://www.huxiu.comhttp://www.huxiu.comwww.huxiu.comhttp://www.huxiu.comarticlehttp://www.huxiu.com137733http://www.huxiu.com1.html

本文被转载1次

首发媒体 虎嗅网 | 转发媒体

随意打赏

  • “听见AI的声音”科大讯飞为听障人士打造春晚无障碍体验

    砍柴网  • 
    在2025年蛇年央视春晚的网络直播中,新增设的“实时字幕”成为一大亮点,据悉本次实时字幕技术由科大讯飞提供。本次春晚为央视第一次在春晚网络转播中采用实时字幕技术,这一举措尤其对于听障群体意义重大,它不仅体现了 科技 的进步,更显示出社会对平等信息权的尊重和关怀,是国民活动对《无障碍环境建设法》
  • 腾讯音乐获得高新技术企业认证,多领域发力革新数字音乐版图

    砍柴网  • 
    2025年1月16日,腾讯音乐娱乐 科技 (深圳)有限公司(简称“TME”)正式被认定为高新技术企业,这一荣誉是对TME在数字文化领域技术创新与卓越实力的高度认可。 多年来,TME始终将技术创新作为发展的核心驱动力,全力推动音乐与前沿技术的深度融合。通过持续的数字产品研发投入,AI 技术
  • 人人都能听懂「最早的中国」!二里头夏都遗址博物馆携手腾讯上线儿童版AI讲解

    砍柴网  • 
    一部 手机 游洛阳,博物馆里过大年。为了能激发更多年轻人的消费力和探索欲,凭借数字化能力「焕活」文物瑰宝,向更多人讲述文物故事,二里头夏都遗址博物馆(以下简称“夏博”)与腾讯QQ浏览器在2025蛇年新春之际,联合推出「博物馆奇妙夜之河洛寻珍」文物寻宝活动。 活动期间,博物馆内「隐藏」了2
  • 科大讯飞:2025,做全栈自主可控的大模型国家队

    砍柴网  • 
    1月25日,以“夯实·飞跃”为主题的科大讯飞2024-2025年公司年会在中国科学技术大学举行。科大讯飞董事长刘庆峰以《踏平坎坷成大道》为主题演讲,分析产业发展态势,交出科大讯飞2024年成绩单、立下2025年新目标,并广发英雄帖招揽人才。 大模型时代,科大讯飞坚持“双轮”引擎:讯飞星火大模型(以下简称“讯飞星
  • AIGC产业创新基地与腾讯共同发布AIPC赋能计划

    砍柴网  • 
    AI 2.0人工智能技术发展迅速,成为推动 商业 革新的确定性变量,为中国零售连锁企业带来了前所未有的挑战,也孕育着难能可贵的机遇。在“2024中国消费产业企业家峰会”上,汇聚了中国消费产业的企业领袖、专家学者和 投资 机构超千人,深入探讨2025新形势周期下消费产业的发展趋势
  • 腾讯混元3D AI创作引擎正式上线

    i黑马  • 
    1月21日,腾讯宣布,腾讯混元3D AI创作引擎正式上线。该创作引擎可通过提示词或图片,直接生成3D模型。此外,还有3D功能矩阵、3D编辑、3D生成工作流、创作素材库等多种功能。文章评价匿名用户发布发布
  • 1分钟能做什么 6000多个大学生在腾讯频道用1分钟暖心支教

    砍柴网  • 
    小学6年级数学考85分算成绩差吗?近日,一位乡村小学生的求助帖引起网友热议:“数学成绩一直停留在85分上下,我很苦恼,请帮帮我吧!”原来,这是在美丽中国“一分钟支教”活动中四川大学的学子们遇到的一个求助。一分钟支教活动以“问题箱”的形式,由正在乡村支教的美丽中国项目老师收集乡村孩子们想问的问题,再由腾讯频道里的热心大学
  • 腾讯音乐人年度报告:“不凡现场”超千场,助力音乐人闪耀舞台

    砍柴网  • 
    近日,腾讯音乐娱乐集团(Tencent Music Entertainment Group,简称“TME”)旗下腾讯音乐人开放平台发布的2024年度报告,展现出过去一年平台在推动原创音乐发展进程中所做出的努力。报告数据彰显出腾讯音乐人开放平台蓬勃的发展态势。入驻音乐人数量实现重大突破,总数超过58万,相较于上一年度,增
  • 腾讯云架构师峰会精彩回顾:智效融合,构筑未来

    砍柴网  • 
    2024 年 12 月 28 日,「智效融合,构筑未来」腾讯云架构师峰会在北京圆满举办。本次峰会齐聚众多一线企业资深架构师和技术管理者、CTO等嘉宾,精心策划了主论坛与两大分论坛,分享架构技术的发展趋势、实践案例、共同探索企业创新与效益的平衡、成长路径等架构师息息相关的硬核内容,更重磅发布腾讯云架构师技术同盟,以及揭幕
  • 天美变阵背后:腾讯 IEG 的 KPI 更高了

    雷锋网  • 
    1月13日,腾讯的2024年员工大会召开。在马化腾点评公司各大事业群的表现时,“非常争气。”相比去年的“躺在功劳簿”,这显然提高了不止一个等级。也就在几天之前,天美副总裁纪泽锋(Q爷),发了这样的一条朋友圈:“事情很简单,纯粹是我本人希望能在新领域做一些探索。”IEG事业群的年会于上周五召开,天美、光子、魔方、北极光四
  • 秦朔牵手腾讯出版《激活2》 详解AI时代的企业增长密码

    雷锋网  • 
    人文财经观察家秦朔团队最新著作《激活:AI大潮下的新质生产力》于近日由中信出版集团正式出版,并在京东、微信读书等渠道上架发售。“AI应用落地、产业云端出海、自主软件创新正在成为企业增长的全新路径。”汤道生在推荐该书时提到,近年来科技和产业发生了剧烈的变化,AI大模型的冲击、宏观经济挑战、市场竞争加剧等等让产业对科技的需
  • 腾讯云24年伙伴贡献1/3收入,SaaS增速超过40%

    雷锋网  • 
    雷峰网从腾讯云官方获悉,2024年腾讯云合作伙伴贡献收入占腾讯云大盘的比例已经超过1/3,而该大盘收入指,腾讯云纯对外的收入,合作伙伴收入包括代理商、ISV等合作伙伴类型。意料之中,PaaS、SaaS依然增速喜人腾讯云渠道去年的收入来自于哪?如果从产品类型上看,Iaas收入仍是占大头,但Iaas的增速是要比PaaS、S
  • 2024年大模型标王出炉,科大讯飞第一,百度第二

    砍柴网  • 
    经过2023年的火山式喷发后,2024年的大模型日渐成熟,在技术性飞升的同时,呈现出产业化密集落地趋势。根据招投标市场数据不完全统计,2023年,市场公开披露的大模型中标项目及中标金额分别仅为 92个、7.89 亿元,2024年猛增至1520个、64.67亿元,公开披露的中标项目及中标金额分别比去年增长了15.5倍及7
  • 帝派智能荣获科大讯飞“AI领航者年度金榜”,用AI持续为企业降本增效

    砍柴网  • 
    1月8日,科大讯飞AI服务市场行业伙伴生态大会在北京中关村国际会议中心成功举办。数百家头部企业、央国企代表、协会机构以及生态伙伴齐聚一堂,共同探索大模型时代的无限可能。作为讯飞的生态合作伙伴,北京帝派智能 科技 有限公司(简称“帝派智能”)受邀参加。 这次活动上举办了AI领航者星榜暨科大
  • 业界唯一!科大讯飞发布首个基于全国产算力的深度推理大模型X1!

    砍柴网  • 
    1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型 中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,作为国内
  • 科大讯飞首发混域知识搜索技术,句子级知识溯源准确率达90%

    砍柴网  • 
    1月15日,科大讯飞宣布讯飞星火4.0 Turbo再次升级。基于行业、图文、长文本等能力的提升,科大讯飞行业首发了混域知识搜索技术。 该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及 互联网 信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率
  • 科大讯飞上线麦芽岛App,打造AI虚拟角色互动新体验

    砍柴网  • 
    随着人工智能技术的日益成熟,AI虚拟角色成为了现实 社交 的有力补充。近期,科大讯飞推出了一款全新的AI虚拟角色互动聊天应用——麦芽岛,在情感陪伴和个性化剧情构建上为用户带来了全新的体验。 麦芽岛App以“有趣的灵魂,麦芽岛制造”为口号,意在打造一个连接虚拟与现实的桥梁。用户可以在应用中
  • 京东与科大讯飞合作再升级 三年冲刺智能硬件百亿市场

    砍柴网  • 
    随着家长们对子女教育 投资 的不断增加,以及消费品以旧换新国家补贴的政策助力,学习机作为教育工具的关键领域,正迎来前所未有的市场发展机遇。1月13日,京东与科大讯飞签署战略合作备忘录,明确了未来三年科大讯飞在京东全渠道销售100亿元的目标。根据协议,双方将围绕产品创新、市场 营销
  • 刘强东给老家送现金红包年货 科大讯飞等企业善举暖人心

    砍柴网  • 
    2025年1月6日,京东联合超百家品牌发起“我给老家送年货”活动,京东创始人刘强东亲自为家乡江苏宿迁光明村选购了34款年货好礼。在这份温暖的年货清单中,科大讯飞助听器与安踏卫衣、洋河梦之蓝、荣耀 手机 等优质品牌产品一同入选,展现了对农村老年人听力健康的特别关注。 此次入选的讯飞智能耳背
  • 科大讯飞星链计划联动AI领航者星榜,解锁商业生态平台2.0

    砍柴网  • 
    1月8日,科大讯飞AI服务市场行业伙伴生态大会于北京中关村国际会议中心顺利举行。本次大会吸引了数百家头部企业、央国企代表、协会机构及行业生态伙伴的积极参与,共同聚焦大模型领域,深入探讨前沿技术趋势,交流创新应用实践成果,致力于在数智化进程中探寻新的发展机遇。科大讯飞高级副总裁、消费者BG总裁于继栋在致辞中分享道:“随着
  • 评论
提交建议
微信扫一扫,分享给好友吧。