小冰、小娜Cortana、Siri、腾讯小鲸、出门问问、科大讯飞、度秘……哪家语音语义技术牛?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

从1945年到2015年,以人工智能为题讲述了许多很美的故事,模仿游戏便是其实之一。但春冬轮回,在人工智能的世界里,人们的幻想像一个小球一样,被抛得高高,也注定摔得惨惨 (1974与1987年两次人工智能寒冬)


这一次,人们对人工智能的幻想被扔得更高了。强人工智能、机器毁灭人类的说法时常有。但这更像是预言家的说法,像阴谋论。目前的人工智能还是基于逻辑与数据、没有直觉,对情感的理解与创造力更是无从谈起。


球被抛得高就一定会落得惨,甚至摔得粉碎。不过,做工程的人更谨慎些,要给这个球栓上一根绳子。这根绳子就是“从实际应用出发、从用户角度考虑”。


语音语义的现状可以大致描绘人工智能在工程界的应用情况。有自主语音语义相关技术且可以在国内使用其服务的几家公司有:出门问问、科大讯飞、云知声、思必驰、百度 (度秘)腾讯 (腾讯小鲸) 以及Google (Google Now)微软 (小冰、小娜Cortana)苹果 (Siri)


到底哪家的语音语义技术牛?


微软小冰属于聊天机器人,主打人机对话,每周例常解锁一种玩法。但微软小冰不能提供太多的实质性的服务,比如查询机票、查询车票、叫车,这些出门问问却能做到。


如何客观的评价技术的优劣?在这个信息交流特别频繁的时代,被使用的人工智能算法大都来自学术界的公开成果,很难有一家公司拥有不属于这个时代的技术。就从语音识别的角度上讲,各个公司的识别率大都在90%以上 (这个问题实际上要复杂些,比如方言识别率、生僻词识别率等就有更多说法了) 。当一家公司的技术只比另一家的好5%或者1%,用户便很难感受到优劣,技术被应用的场景便成了重要的不同之处。


人工智能语音语义系统的基本实现方法


这些公司的语音语义技术都和“云”离不开关系。人工智能系统按照一套逻辑推理程序,在海量的数据中寻找其认为最正确的答案。这就意味着,被使用的人工智能系统其覆盖的领域越广,就越是对数据以及运算能力饥渴。小型离线设备,如手机、家用电脑都无法满足这样的需求。解决办法是搭建一个拥有超强处理能力以及海量数据的“计算机集群”,并将其接入网络,也就是我们所说的“云”。搭建了AI语音语义系统的云就是AI语音语义云,是这些AI公司的基础设施。


搭建了智能云之后,还需要合适的语音输入端口。这个端口可以来自公众号、APP这类软件,也可以来自音箱、可穿戴智能手表这类硬件。


如何正确看待目前市面上知名的语音语义系统?


虽然人工智能系统的概念很广,具体到语音语义的概念还是很广,因此这么多类似但不同的人工智能公司在不同方向上深耕。从用户角度看,这些产品的不同之处还蛮大。


擅长搜索查询消息的个人助理的有腾讯小鲸和出门问问


1、腾讯小鲸 目前公开的信息较少,主要被嵌入TOS系统。与Ticwear类似,TOS系统被搭载在智能手表当中。不过,小鲸的功能与其他语音助手类似,可以设置闹钟、查询信息,但不能像出门问问那样直接叫车、订咖啡。


有资料显示,曾在GoogleBrain工作过的工程师创立了名为ScaledInference的公司,该公司的种子轮投资者就包括腾讯首席探索官David Wallerstein和腾讯本身。另外,也有消息称,腾讯没有停止其他视觉识别产品的研发。


这有点像微信当年的研发。


2、出门问问 主要做2C (面向消费者) 硬件产品,其智能手表Ticwatch是国内销量较高的一款全交互智能手表。出门问问的人工智能语交互技术自成体系,包含语音识别、语音合成 (TTS) 、语义理解、垂直搜索、智能推送5个部分。其最大的特点是可以语音呼唤本地化生活服务,导航、看新闻、查天气等都可以通过手机APP或者手表实现。


最近,出门问问推出了内测版的“魔法小问”,要把人工智能从查询信息——如“今天有什么电影”——提升到提供完整服务,如直接帮助用户订电影票。这一点是其他智能系统做不到的。


擅长连续对话的“聊天机器人”有图灵机器人和度秘


3、图灵机器人 主要做2B业务,其语音语义系统与小冰很相似,是连续对话机器人。图灵可以被嵌入微信公众号、APP、网站或者智能硬件,用户可以让它讲笑话、做游戏,也可以用它查快递、查新闻。最近图灵机器人接受了奥飞动漫的投资,走智能儿童玩具的路。


4、度秘 是百度推出的一款与小冰类似的连续对话机器人。另外,用户可以在对话的同时,查询“图灵是谁”这样的信息——这借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的实体机器人”小度“。


还有一类人工智能系统即不是助理也不是聊天机器人,而是被用于做智能语音交互解决方案,他们有讯飞语音云、云知声的、思必驰


5、科大讯飞的“讯飞语音云” 包括语音合成、语音识别和搜索、语音听写等技术,该云对方言、生僻字的语音识别率较高。讯飞语音输入法就是基于此云开发的。科大讯飞“主要”做的是2B (面向企业用户) 服务,将自己的人工智能服务授权给其他企业。


另外,科大讯飞在最近几年也开始发力2C (面向消费者) 的产品,比如智能音箱、录音宝、录音笔等硬件。可以看到,科大讯飞的产品多是智能化的传统产品,而非个人助理或聊天机器人。另外,科大讯飞偏向深耕“语音识别”,而非连续对话。


6、云知声 主要做2B业务,方向是智能家居和车载市场,这里便有了与出门问问类似的“软硬结合”的概念。


与“可穿戴设备、手机及电脑上的智能语音语义系统”不同,智能家居语音系统的声源可能很远且被噪音包围。也正因此,云知声把推广的重点放在了“声源识别、噪声抑制、回声消除”以及指令的识别上,而非对用户意图的理解上 (语义理解)


值得一提的是,在京东与科大讯飞宣布“在一起”的时候,阿里与云知声就达成了合作。不过,最近一段时间,未有相关消息。


7、思必驰 与云知声的方向挺相似,为企业客户提供智能硬件语音交互方案,比如通过语音控制智能硬件的开关。思必驰在车载领域的合作多一些,比如车萝卜。最近,思必驰又宣布完成了融资,要把“智能语音融进硬件”这条路走得更远些。


8、小冰、小娜(Cortana)、Siri和Google Now


Cortana、Siri和Google Now,即是聊天机器人,也是个人助理。


微软小冰与微软小娜都基于必应搜索和深度神经网络等技术,属于2C产品。微软小娜如今可以在iOS、Android、Window 10系统中使用,她更像一个秘书,可以打电话、发短信、发邮件以及查询上一场曼联的比分。但是微软小娜在国内手机中的功能少很多,语音响应很慢。


微软小冰作为一个对话系统,入驻于微信、微博等应用或者Windows 10系统中,她也可以查询各种信息。与小娜不同,小冰不可以调用电话等应用,她更像一个虚拟人物,可以陪用户聊天 (连续对话) 、玩游戏 (基于图像识别等人工智能技术)


总的来看微软小娜和小冰代表着微软的两个方向:小冰连续对话能力强,可移植行强,因此可以嵌入到微信、微博、美拍等应用中。小娜是Window 10配套的人工智能系统,能够调用Windows 10中的各种应用和数据,被视为个人助理。


Siri 大家熟悉,是一款可以调用应用的聊天机器人。如今的Siri除了定闹钟、发短信以外,还可搜索照片、播放音乐、提供建议。它或许不是最强大的,但更面向用户。


Google Now 在国内无法良好的使用,对中文的识别效果很差,中文版的能力也很弱。但是作为Google的产品,它天生便有了比其他人工智能产品更多的数据、更好的数据挖掘能力,这使得Google Now成为了一款“主动推送”能力很强的助理产品。


Google Now凭借与Chrome浏览器、Gmail、Google日历等等Google应用以及Android系统的“近亲关系”,使得其可以实现很多其他产品做不到的功能。比如,语音解锁、任意界面“OK,Google”唤醒、主动推送你喜欢的和你需要的“即时帖”。有人曾称赞:


“早上醒来,我惊奇的发现Google Now居然直接告诉了我去兼职工作的路上所要花费的时间。但是我没有设置,而且那不是我真正工作的地方。”


可以看到,Google从用户的地理与实践信息中明白了他何时去何地兼职。但仍需强调,Google Now在国内的功能很少,而且实现一些即时功能,用户必须把个人数据交给Google。


作为巨头推出的产品,小娜、Siri和Google Now经常被媒体用来比较,但这种比较有些不太恰当。一方面,几款产品中,只有Siri的易用性在国内不错。另一方面,人工智能系统要明白用户的用意,必须获取数据——越多越好。因此,人工智能系统必须入驻更多的软件或者平台,获取更高的权限。小娜虽然入驻了Android与iOS,但她仍然是微软的产品,在Windows 10上才有更好的易用性。同样,Google Now与Siri分别是Android阵营与iOS阵营的产品,前者擅长挖掘数据、主动推送,后者擅长聊天、被动建议。


可以看到,这些语音方面的人工智能公司有业务2B或2C的,选择软硬结合或者只做软件解决方案,深耕智能家居或者智能穿戴。这些选择,无分对错或者好坏。但总体来看,人工智能仍然没有认知能力,人与人工智能聊天又涉及到感情投入——这是一个超出自然科学范畴的问题。用户对智能家居的认知度还不够高,相关产品不够成熟、定价不够亲民。这样看,搞智能家居系统这样的生态,似乎有点望得太远。


因此,人工智能在普通消费者身上的落地是否可以先在“一个点”上引爆,比如人工智能系统作为助理,从仅可查阅机票信息提升到可以提供订票服务。

*文章为作者独立观点,不代表虎嗅网立场
本文由 科技行业观察 授权 虎嗅网 发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处( 虎嗅网 )及本页链接。原文链接http:http://www.huxiu.comhttp://www.huxiu.comwww.huxiu.comhttp://www.huxiu.comarticlehttp://www.huxiu.com137733http://www.huxiu.com1.html

本文被转载1次

首发媒体 虎嗅网 | 转发媒体

随意打赏

  • 百度、腾讯或字节,谁能最终牵手苹果AI

    虎嗅网  • 
    本文来自微信公众号:经济观察报,作者:任晓宁,题图来源:视觉中国 12月19日,据路透社报道,苹果公司 (下称“苹果”) 正与腾讯和字节跳动商谈,将其AI模型整合到在中国销售的iPhone中,该商谈还处于非常早期的阶段。 苹果在国外的AI模型合作方是OpenAI,其功能在国内无法
  • 余承东自曝智界、问界有车型亏钱在卖,最高亏3万,暂时赔本也得赚吆喝;传苹果与腾讯、字节、智谱接洽大模型合作;极越员工获N+1赔偿丨雷峰早报

    雷锋网  • 
    要闻提示 1.余承东自曝智界、问界有车型亏钱在卖,最高亏3万,暂时赔本也得赚吆喝2.TP-Link或成又一个华为:曝美国正考虑对其实施禁令,此前面临多次专利诉讼,商务部回应:别搞有罪推定3.苹果被传与腾讯、字节、智谱三家初步接洽大模型合作,此前传与百度合作不顺4.极越汽车离职补偿出炉:“N+1”赔偿,
  • 曝苹果就国行iPhone AI与腾讯、字节、智谱接洽,百度或不再是第一选项

    虎嗅网  • 
    本文来自微信公众号:新皮层NewNewThing,作者:吴洋洋,编辑:吴洋洋,原文标题:《除了字节和腾讯,苹果也在与智谱谈判使用其大模型|新皮层独家》,题图来自:Unsplash 第一财经“新皮层”独家获悉, 苹果也在与智谱就在华版本的iPhone中使用其大模型进行谈判。 这使得目前在与苹果就同
  • 从“接受帮助者”到“需求决定者” 腾讯基金会探索参与式资助 让受助人上线

    砍柴网  • 
    气候急剧变化之下,数字技术如何精准地帮扶到老人、孩子等脆弱人群?12月18日,由《中国慈善家》杂志主办、腾讯基金会支持的2024年度慈善年会在北京举行,会议主题为“应对气候变化的公益行动与慈善新前沿”。腾讯基金会项目总监曹帆表示,在数字备灾和“一老一小”等脆弱人群的帮扶上,腾讯基金会正改变传统的“给受助人帮助
  • 苹果正与腾讯、字节谈判:将人工智能整合国行版iPhone中

    砍柴网  • 
    12月19日消息,据国内 媒体 报道称, 苹果 正在与腾讯、字节跳动谈判,以将其人工智能功能整合到在中国销售的iPhone中。 报道中提到,苹果本月开始在其设备中接入OpenAI的ChatGPT,Siri会调用ChatGPT,不过ChatGPT并未在中国上市。据悉,苹果与
  • 捷停车×腾讯地图:新功能上线,让便捷与优惠触手可得!

    砍柴网  • 
    最近,腾讯地图再出“猛招”,进一步为车主朋友解决出行停车难!现在打开腾讯地图,可直接查看捷停车提供的优惠停车套餐,并快速享受捷停车·车位优选服务~车位优选,是捷停车基于AI+大数据技术及车位运营服务的成熟经验,经市场验证后推出了车位套餐交易平台,旨在拉通车场车位资源和车主停车需求,高效匹配供需关系,通过智能运营策略为车
  • 腾讯音乐娱乐集团执行董事长彭迦信:巩固正版化成果,持续加强音乐版权保护

    砍柴网  • 
    11月28日,第八届中国网络版权保护与发展大会于贵阳拉开帷幕,这场盛会迅速成为行业焦点,汇聚各方力量共探网络版权保护与产业发展之路。大会围绕核心主题 “加强版权法治保障 护航新质生产力发展”,精准设置多个关键议题,例如“强化版权执法保护”“探索 AIGC 版权问题”等,通过系列分组讨论、专题研讨,旨在理清行业脉络,找出
  • 腾讯网易殊途同归,追赶《原神》寸步不停

    i黑马  • 
    来源:Tech星球(ID:tech618)  作者:陈桥辉开放世界游戏的风,又吹了起来。腾讯、网易两家游戏大厂,在开放世界游戏赛道上又有所动作。12月1日,腾讯继续注资《鸣潮》的开发公司——库洛游戏公司,持股比例超过由原来的27%上升到51.4%,成为唯一的外部股东。《鸣潮》是米哈游旗下游戏《原神》的
  • 腾讯云OBS、阿里云OSS等SDK适配原生鸿蒙,应用数据存储更可靠

    砍柴网  • 
    数据传输与管理是各类应用所必须的基础能力,数据传输速度快慢、管理是否便捷、存储是否安全,都会影响用户的使用体验。对于开发者来说,相比从头开发数据存储和管理功能,接入成熟稳定的存储类SDK可显著降低开发工作量,减少后顾之忧。近期,腾讯云对象存储SDK、iobs平安文件云SDK、七牛云存储SDK、火山veImageX SD
  • 构建大模型时代的数据基础设施,腾讯云发布全新一代数据智能平台TCHouse

    砍柴网  • 
    大模型时代,大数据技术发展也迎来了全新的构建范式。12月12日,腾讯云宣布发布全新一代数据智能平台TCHouse-X。该平台采用一体化、智能化、高性能、云原生等理念打造,大幅简化了传统数据平台的复杂架构,并引入了智能化系统交互、资源管理与运维管理能力,能够为大模型时代的应用创新提供一站式数据处理能力,助力企业高效释放数
  • 中国石油发布700亿参数昆仑大模型,与中国移动、华为、科大讯飞联手打造

    砍柴网  • 
     11 月 29 日消息,据中国石油报,11 月 28 日,以“AI 领航・智绘能源”为主题的 700 亿参数昆仑大模型建设成果发布会在京举办。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的 700 亿参数昆仑大模型,展示了 43 个专业应用和通用应用创新场景。 在行业大模型方面,昆仑大模型语言大
  • 讯飞星火开发者生态迅猛发展,科大讯飞携生态伙伴引领大模型规模化落地

    砍柴网  • 
    10 月 24 日,第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节开幕上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火 4.0 Turbo。对于科大讯飞来说,每年的 10 月 24 日,都会举办一年一度的全球 1024 开发者节,同时举办世界声博会,吸引成千上万的程序员、开发者前往「
  • 重新弄定义多模AIUI标准,科大讯飞首发语音视觉虚拟人交互“三合一”

    砍柴网  • 
    10月29日,已经预热半年的 Apple Intelligence 终于登台亮相,不过仅支持部分地区的英语语言,也还只是 Beta版本。当下,全球包括中国的大部分国家及地区的消费者仍无法享受到Apple Intelligence。 在此前秋季新品发布会上, 苹果 用了超过一半篇幅来展示新系统在
  • 科大讯飞持续勇探大模型国产化“无人区”,“飞星二号”正式启动

    砍柴网  • 
    2024年下半年是大模型发展由虚向实的重要阶段,在大模型赋能实体 经济 的过程中,对算力产生了爆发式需求。中国科学院院士陈润生在2024中国算力专家研讨会上表示:“大模型是新质生产力的代表,大模型和超级计算的融合发展十分重要”。日前,国产大模型正致力于给世界提供“第二选择”。10月24日,在2
  • 科大讯飞AI文娱论坛,重构内容与表达的盛宴

    砍柴网  • 
    10 月 24 日,2024 科大讯飞全球 1024 开发者节 AI 文娱论坛在合肥圆满举办。论坛以「重构内容与表达」为主题,旨在探讨 AI 时代下文娱产业的最新趋势,见证讯飞 AI 文娱业务的重大发布,与合作伙伴共同推动文娱行业的繁荣发展。科大讯飞副总裁&研究院院长刘聪、科大讯飞消费者事业群副总裁严亚路出席大
  • IDC:科大讯飞语音语义市场份额第一

    砍柴网  • 
    根据国际数据公司(IDC)最新发布的《中国AI语音语义市场2024年上半年市场份额》报告显示,2024年上半年,人工智能语音语义整体市场规模为72.3亿元人民币,同比增长18%。在追踪调研的主流语音语义厂商中,科大讯飞市场份额持续领先,位居榜首!同时,在对国内主流基础大模型的测试中,讯飞星火位居第一梯队,比肩全球大模型
  • 联合中国教科院,科大讯飞首发“高中数学智能教师系统”

    砍柴网  • 
    10月24日,科大讯飞联合中国教科院首发”基于问题链的高中数学智能教师系统”,它是众多高中数学优秀教师集体智慧与AI大模型智能的综合体,是知识与智能双轮驱动、人师与机师双向赋能的技术创新,试点应用获得好评。此外,最新星火智慧黑板2.0也将于10月25日第84届教育装备展上正式发布, AI均衡视听更公平、AI教学工具更高
  • 科大讯飞首发汽车端侧星火大模型

    砍柴网  • 
    10月24日,科大讯飞首发 汽车 端侧星火大模型,相比云端大模型,端侧1.3B大模型效果损失≤1%,端侧首响40ms,端云融合交互低至1.3s。今年第四季度起,奇瑞、广汽、长城等多款搭载端侧星火大模型的车型将上市开售。
  • 科大讯飞全球1024开发者节举办在即,重磅发布多模态视觉交互及超拟人虚拟人交互能力

    砍柴网  • 
    2024 年诺贝尔物理学奖和化学奖都与人工智能研究相关。物理学奖授予了机器学习先驱约翰·霍普菲尔德和杰弗里·欣顿,他们使用物理学工具设计了人工神经网络。化学奖则一半授予了谷歌旗下 DeepMind 公司的德米斯·哈萨比斯和约翰·江珀,他们设计的人工智能模型「阿尔法折叠」可以预测几乎所有蛋白质的三维结构。这些成果不仅展示
  • 2024前三季度大模型中标排行榜出炉 科大讯飞中标数量及金额均列第一

    砍柴网  • 
    随着人工智能技术的快速发展,大模型已成为推动行业数字化转型的重要力量。智能超参数最新发布的报告显示,在2024年前三季度,科大讯飞在大模型中标项目数量和金额上均位列行业第一,展现了其在AI领域的强大竞争力。据智能超参数统计,2024年1-9月,中国大模型市场招投标市场活跃,公布的中标项目数量达到653个,中标金额高达2
  • 评论
提交建议
微信扫一扫,分享给好友吧。