全球最大语音识别公司Nuance的衰落与自我救赎
近日,语音识别巨头Nuance以2.15亿美元收购客服解决方案提供商TouchCommerce。
针对这次收购事项外界称,Nuance和TouchCommerce优势较为互补,前者的优势在于语音识别、语义处理技术,而后者拥有客服解决方案经验,TouchCommerce的线上线下服务数据可为Nuance提供针对性的数据训练,两者结合将有助于进一步提升人工智能客服的智能程度和适用范围。
这里有个疑问,Nuance原本作为一家纯语音技术提供商为何转型切入商业化产品领域,推出企业服务解决方案?
这十几年里,Nuance经历了无数次起起落落:曾被苹果、Google、三星捧在手上,被绝大多数语音产品公司为之朝贡,而之后却连连遭遇市值暴跌、技术瓶颈、客户流失、离职潮、错过最佳出售时间等,最终不得不从只专注纵向深耕算法的技术提供商转型为横向扩展各行业解决方案的公司。
“Nuance依赖症”和“Nuance恐惧症”
雷锋网(搜索“雷锋网”公众号关注)曾多次报道过关于Nuance的深度文章,文中指出Nuance第一次被众人熟知源于他们与苹果之间的合作。当时被誉为下一代交互系统的Siri采用了他们的语音技术后,这家名不见传、闷声钻研技术的公司瞬间被各大媒体相继曝光。其实在与苹果合作之前,他们已经跟多家知名厂商保持合作关系,其技术被应用于手机、电视机、汽车等产品中,其中三星的语音助手S-Voice也采用了Nuance的技术。
在大客户方面,Nuance拥有苹果、三星、任天堂等公司,由于整个语音技术市场上Nuance一家独大,技术远超同类竞争对手,这使得客户群对其依赖度都非常高。在大客户业务上如鱼得水的Nuance,收购许多比它体量更小的竞争对手。
据美国《商业周刊》曾报道,2000年以来,Nuance已经先后收购了40多家竞争公司。Nuance公司的CEO Ricci非常倾向于利用诉讼手段削弱那些具有创新力的竞争对手,以便用极低的价格对其进行收购,或让它们破产。初创公司 Vlingo 的 CEO Dave Grannan曾公开表态:
和Nuance竞争就像传染性病一样,我们在和他们的直接竞争中处处领先,但就当你认为生活充满了美好时,呯!好日子就这样结束了。
而另一家初创公司Tellme的前CEO McCue曾提到,很多公司无法顶住Nuance的压力,最终屈服,而且这样的事情还在不断发生。
那个时期的Nuance拥有绝对的地位和行业话语权,任何与之相联系的公司不得不向它俯首称臣,巨头们对其也礼让三分。
然而,在不知不觉中,这个语音巨擘正在面临空前的危机,自己却悄然不知。
语音帝国摇摇欲坠
Nuance在短时间内同时面临多个致命问题的考验,而且问题都是连环性的,一处破裂,整个环节都有可能崩塌。
技术天花板
Nuance的语音技术是以统计推断方法为基础,着眼于音素(音节的声音)和语境来识别话语。在识别方面,Nuance的算法和专利均领先其他竞争对手。然而语音识别技术并非高不可攀,尤其在2010年以后,专利和算法在语音应用场景中的作用越来越小。各家语音的纯识别率逐渐趋于同一水平线,差距不再可感。如果继续深耕识别技术,路会越走越窄,成本与提升的效果远不成正比。
客户流失
就在此时,深度学习空前火热,其被广泛应用于语音技术当中,省去很多语音模型创建环节,使得难度、成本、时间均大幅下降,一大批厂商纷纷涌入这个行业与Nuance在同一维度展开竞争。而此时苹果、三星、Google等公司为了摆脱对Nuance的依赖,均着力于开发自己的语音技术,Nuance在技术上的优势逐渐不在,客户也慢慢开始流失。
核心人才频繁被挖
那些流失的客户为了聚拢大批人才开发自己的语音产品,开始挖Nuance的墙角。苹果作为Nuance的战略合作方,其挖人动作最为高调,苹果在Nuance的老巢波士顿悄悄设立语音技术研发团队,苹果不仅吸纳了为Siri服务的语音技术人才,更是将Nuance公司的多名高管和高级语音研究人员招募进来,其中包括Nuance前研发副总裁Larry Gillick以及语音资深科学家Gunnar Evermann、Don McAllaster等。
与此同时,Google为了避开Nuance的专利障碍,挖走在Nuance工作十年的联合创始人Mike Cohen,让其担任“语音掌门”开发相应的语音识别技术。有趣的是,小米全球副总裁Hugo Barra,也曾是Nuance的产品经理,于2008年被Google招入麾下。
核心人员流失意味着Nuance的技术壁垒被变相“瓦解”,大公司对它的依赖不断减小,这对于依靠技术输出来获取收入的Nuance来说,无异于灭顶之灾。
出售or转型
如果继续靠技术输出几乎就是死路一条,因此Nuance曾多次试图开拓新业务,此前欲进入移动端大干一票,但此时Google已将语音识别软件免费授权给Android开发者,而Nuance显然不乐意参与到这场免费的游戏当中。而Nuance开发面向C端的消费级产品,也似乎并不被市场认可。
此时,Nuance面临两条路选择:要么出售,要么丢掉过去,全力转型为企业解决方案服务商。
此前曾传言三星、苹果、百度均有意向收购Nuance,但最终无功而返。分析师称,Nuance的雇员超过15000人,交易规模也在50至60亿美金以上,因此潜在收购者吞并体量庞大的Nuance存在是否划算的问题。
眼看出售这条路很难走下去,那只能走第二条路,转型为解决方案提供商。
转型之路
为了在企业级市场占有一席之地,Nuance成立四个业务部门:
医疗业务部,提供医疗中的病历管理及手册转录服务。
企业业务部,为银行或者电信行业提供客户服务及呼叫中心应用。
移动设备业务部,提供手机与汽车设备中的指令及控制功能、语音查找及短信应用。
图像业务部,提供MFP多功能扫描、PDF以及文件自动化操作解决方案。
医疗解决方案
四个业务部门中,收入最多的是医疗业务部,该部门的业务是为临床专业人士提供语音导航文件系统和应用程序,Nuance的医疗应用可与其他公司的医师档案记录工具相整合,实现病人在不同临床系统、不同医疗平台、院内院外的电子病历记录完整性,有效提升医师的诊断效率。数据统计称,医生每年使用Nuance的临床语音识别技术产品记录近一亿病人的数据。根据市场反馈,94%的医疗机构正在考虑或有强烈兴趣使用临床语音识别技术。医疗业务不仅让其找到了持续造血的新源头,而且为医疗机构解决了实际问题。此外,电信运营商和银行也是其重点客户。
呼叫中心解决方案
企业业务部的一项重要产品就是Nuance Recognizer(呼叫中心自助服务解决方案),全球绝大多数电信运营商、银行均采用了该呼叫中心解决方案,Nuance语音解决方案每年自动处理超过120亿次电话呼入互动业务。随着人工智能客服的兴起,Nuance也在通过收购TouchCommerce等相关公司来紧锣密鼓地布局此项业务,让呼叫中心实现无人化更进一步。
移动应用产品
除了企业级重型产品外,Nuance还推出较为常见的语音转文本和输入法软件,此外,还针对于客户服务提供了Nina虚拟助手、会话式IVR(忽视语音应答)、托管平台等系列解决方案。被用户熟悉的车载语音助手Dragon Drive(声龙驾驶)也被多家汽车厂商采用,该产品与Google Now相似,驾驶员可通过语音的方式安排日程、订餐、听歌、导航等。
声纹技术
在扩大自己企业业务的同时,Nuance仍旧不忘其本质:语音技术。近年来,Nuance研发出最新的声纹技术,通过声音来记录和判断用户身份。该技术的落地应用可为客户量身定制电话客户服务解决方案,通过分析呼叫者与坐席自然交谈期间的语音内容来验证合法呼叫者的身份,并实时检测已知欺诈者。提升了其所有语音产品的安全性。
总结
Nuance从语音技术发家起步,经历多次波折后逐渐将其技术整合到服务和流程当中,并独立开发出行业解决方案为客户提供强大的产品支持。 如今,医疗保健、电信、金融、移动应用等行业内成千上万的公司均通过自然语言的交互方式便能利用Nuance产品带来的多维度服务,这为很多处于转型阶段的语音技术公司起到了非常大的借鉴作用。