思必驰:语音交互是智能硬件未来发展的核心

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

思必驰作为国内专攻语音技术的公司,已有8年行业经验。这8年里,CEO高始兴带着团队先后做过汉语教学、英语口试,到现在为 智能硬件 大品牌做语音技术背书。然而,每每当人们提到语音技术时,最先想到的可能是科大讯飞。毕竟是国内发展较早、背后团队实力较高的公司。但是面对“晚到”的劣势,高始兴直言,语音交互现在还是一片蓝海,未来还有诸多可能性。

CEO高始兴

思必驰什么来头?

在语音技术已经历“七年之痒”的思必驰,能走到今天也先后进行多次转型。最开始团队是在剑桥进行汉语教学有关的语音技术研发,为学习汉语的老外提供练习和测评。不过因用户需求并没有想象中的多,这个做了一年仍只有100多名学生的项目不得不变卖。回国后,他们在苏州继续进行 语音识别 、语音合成、声纹识别的研发工作,这次他们把重要项目重要集中在教育和智能硬件语音交互领域。2015年,已经独立出来的教育事业部驰声科技有限公司被网龙收购,高始兴说他们从今年下半年起,要专注智能硬件语音交互的研发。

做出这样的选择,可以说既是主动也是被动。主动是因为高始兴看准 移动互联网 未来发展趋势,做壮士断腕的选择。说是被动,是因为语音技术巨头科大讯飞早已在教育和智能穿戴领域拔得头筹。

对手在做什么?

科大讯飞做语音技术已经有十几年时间,其总部在安徽合肥。2012年,中国移动以19.4元http://www.leiphone.com股的价格认购科大讯飞非公开发行股票7027万股,涉及金额高达13.63亿。有了中国移动做“干爹”,科大讯飞开始向智能语音、门户、云服务大力进军。有数据统计,中国电子企业百强名单中,前10名有8个都在使用讯飞的技术,霸权地位显而易见。加之近段时间与咪咕文化、坚果手机都有深度合作,业务领域逐步拓展。但是其收益最大的还是教育。2013年,是中国在线教育元年,科大讯飞当时就将公司1http://www.leiphone.com3的人力投入在线教育,业绩以每年50%的比例递增。作为为数不多的与公立学校进行合作的语音技术公司,众多学生用户他们描绘了极具潜力的市场前景。相应地,这也许是思必驰放弃驰声科技,寻找下个路口的又一诱因。

和讯飞的这场仗该怎么打?

谈到互联网公司,过去人们还拿“第一生、第二平、第三以后必死”的定律津津乐道。而如今,眼前一幕幕让人唏嘘不已的合并然人感叹原来即便排在行业第二,在资本寒冬下,也不是那么好过了。做语音技术公司也一样,虽然这一行竞争对手不多,但是"正襟危坐"的科大讯飞,成为思必驰下一步要想有大作为的不小阻力。谈到科大讯飞,高始兴坦言其实力的确强劲。但是敢与之抗衡,高始兴列出了三个优势:

1. 人才

高始兴一行人从剑桥归来,掌握着世界一流的语音技术。据他介绍,剑桥在语音合成技术方面处于世界领先水平。每年世界上有关语音技术的大奖赛,冠军几乎都是来自剑桥。所以他对自己的团队非常有信心。

2. 差异化定位

科大讯飞虽老练,但只有教育和车载是其主打点,像智能家居其起步还相对较晚。主打差异化定位后,思必驰先从智能家居入手。据了解,思必驰马上要和小米在智能家居领域开始合作,为其提供语音技术支持;和阿里巴巴的车载系统的合作,也已经提上日程。

3. 技术突破

去年,高始兴在接受雷锋网记者采访时表示,语音对话当时还只有思必驰能实现。一年后,这已经成了语音技术的标配。下一步,他们打算使用新算法对人的声音进行建模。届时他们可以快速、准确地实现语音识别与对话,让硬件更“懂”你。为检测系统语音识别的精准性,高始兴即兴对着手机念了一首诗,合成文字只字未错。

未来语音技术会如何发展?

科大讯飞虽然从2000年初开始语音研发,但是直到2010年百度涉水语音技术研发以后,语音技术才开始满满火热起来。从开始的通用场景语音识别、到多场景问答、再到人机交互,语音开始成为连接人与物质世界的另一个终端。谈到这里, 高始兴预测,语音交互是智能硬件未来发展的核心。

上个月,李克强总理在百度与机器人“小度”的对话就上了新闻的热搜榜。现场有人问“小度”:“你对北京的城市管理有什么建设性的意见啊?”“小度”思考一会后回答:“什么时候不堵车就好了。”幽默的回答引得全场同行人员哈哈大笑,并直夸其聪明。

也是今年10月,亚马逊发布智能音箱,苹果收购VocalIQ,谷歌战略入股出门问问。国际市场,对智能语音的前景也颇为看好。

由此来看,语音技术的前途长远而璀璨。不过正如第一次世界大战爆发前人们认为世界都是完全和平的乐观一样,真实的智能语音前景如何?现在是否有泡沫。是否所有场景都适合语音连接,语音能否连接新的 生态系统 ?一旦语音成了新终端,用户个人信息安全如何保障?真正的企业家,要站在未来看现在,也要想清楚未来产品的背后,带给用户的到底是什么。

随意打赏

  • Galaxy 全球新品发布会在即 三星以全息影像秀展示手机交互新方式

    砍柴网  • 
    摘要:融合沉浸式全息投影和语音元素打造的创新活动,象征着Galaxy AI移动体验新篇章的一次重大突破。2025年1月17日,三星电子在伦敦上空上演了一场全息投影秀,为即将到来的三星Galaxy全球新品发布会进行预热。活动现场,伦敦上空犹如一块巨幅画布,向全球观众展示了移动AI新时代的样貌,同时在全息投影与语音元素的结
  • 多模态交互+健康新突破,歌尔发布新一代智能指环参考设计

    砍柴网  • 
    近年来,传感器技术、大数据、云计算、物联网以及人工智能技术的蓬勃发展,为智能穿戴设备集成更多健康监测功能提供技术支持。智能指环作为新型可穿戴终端,可将最新技术与生活方式结合,凭借其便携和实时性在健康监测、交互领域展现出独特优势。 在2025年CES上,歌尔发布新一代智能交互指环参考设计Comma 2系列,将多种
  • 【再携手】云知声xTCL,共铸新风空调语音交互新篇章

    砍柴网  • 
    近日,云知声收到一份特别的新年礼物——一封来自TCL的感谢信,再次温暖了云知声团队的心。信中特别赞扬了云知声在TCL小蓝翼C7新风空调语音3.0项目中的卓越贡献和专业精神。以下为感谢信原文:信中提到的TCL小蓝翼C7新风空调,是TCL在12月19日正式发布的一款AI新风空调。据悉,这款空调专为改善睡眠而来,聚焦AI睡眠
  • 谷歌Android XR SDK开发者预览版上线:2种空间交互、多模态输入,打造极致沉浸体验

    砍柴网  • 
    12 月 28 日消息,谷歌最新宣布推出 Android XR SDK 开发者预览版,并宣布用户可以在 Home Space 和 Full Space 两种模式下,体验和使用应用。空间模式谷歌表示在 Home Space 中,用户可以同时使用您的应用和其他应用,实现多任务处理。在 Full Space 模式下,应用是用
  • HarmonyOS NEXT重塑二维艺术 让交互体验“活”起来

    砍柴网  • 
    在全面屏时代,数码产品的操作方式已经焕然一新,用户主要通过滑动和轻触来与设备互动。然而在操作触控屏幕时,常常会让人觉得反馈不足,不够“爽快”。为了解决这个问题,‌HarmonyOS NEXT通过独有引力动效体系,通过模拟真实世界的物理效果,‌让用户在操作系统时犹如获得在现实生活的动作反馈一般,仿佛系统交互真的“活”了起
  • 微软发布Win11 Beta 22635.4655预览版:开始菜单网站推荐更精准、升级Spotlight交互

    砍柴网  • 
    12 月 14 日消息,微软昨日(12 月 14 日)发布博文,面向 Beta 频道的 Windows Insider 项目成员,发布了适用于 Windows 11 的 KB5048753 更新,用户安装后版本号升至 Build 22635.4655。一、优化和改进(逐步推出)1.1、开始菜单微软根据 Windows
  • OpenAI推出Projects,功能全家桶打造ChatGPT新交互方式

    砍柴网  • 
    12 月 14 日消息,“OpenAI 12 天”活动进入第 7 天,OpenAI 公司为 ChatGPT 带来了 Projects 功能,支持用户上传文件、设置自定义指令、分组聊天和数据等,让其更容易根据需求定制 ChatGPT。Projects 功能整合支持 Canvas 以及 ChatGPT Search 网络连
  • 埃克塞尔智能电梯闪耀广州设计周,智能交互功能再升级

    砍柴网  • 
    在12月7日广州设计周次日的璀璨舞台上,埃克塞尔智能电梯以其创新设计和前沿智能交互功能,成功让智能美学概念落地于生活。在深度洞察市场需求后,埃克塞尔将3C智能交互技术与奢华材料巧妙结合,为观众带来了全新3C系列LOB X-01外呼旋钮及HOB X-01智能触控人机交互系统,吸引了众多业内人士和消费者的目光。发布会现场,
  • 首批!“讯飞AI虚拟人交互平台”获中国信通院大模型数字人基础能力L5最高级认证

    砍柴网  • 
    近日,科大讯飞的 AI 虚拟人交互平台顺利完成中国信通院人工智能研究所组织的大模型数字人基础能力分级测试,并获得最高等级 L5 的认证。这也是既 23 年「讯飞智作」通过中国信通院最高级「卓越级」「可信虚拟人认证后,科大讯飞再次迎来的行业认证的最高荣誉。「讯飞 AI 虚拟人交互平台」通过中国信通院大模型数字人基础能力
  • 加速应用智能化革新,阿里云智能语音交互等人工智能类SDK已适配原生鸿蒙

    砍柴网  • 
    在千行万业应用加速拥抱鸿蒙的同时,各领域的SDK也在积极适配原生鸿蒙,帮助开发者们快速集成各类能力。近期,易道博识SDK、商汤滤镜SDK、合合OCR SDK、平安智能定损SDK、译图智讯OCR SDK、火山引擎智能美化特效SDK、阿里云智能语音交互SDK、智言语音评测SDK等行业标杆级人工智能类SDK已适配原生鸿蒙,覆
  • 评论
提交建议
微信扫一扫,分享给好友吧。