首发丨声智科技完成2亿元B轮融资,专注声学语音技术和语言智能服务
12月29日消息,声智科技(SoundAI)今日宣布已完成B轮2亿元融资,本轮投资由毅达资本领投,峰瑞资本、正居资本跟投,中关村银行、InnoVen Capital联合参与。
本轮融资后,声智科技将继续投入声学前沿技术和 人工智能 交互技术的研发,持续不断的挖掘用户需求,保持新技术快速研发迭代,打磨产品的极致用户体验,拓展平台服务落地更多的语音智能垂直场景,为用户提供更多优质的语音交互技术和语言智能服务,加速在各行业的业务拓展以及产品和平台服务的规模化落地应用。
多年积累,专注语音方案前端
据了解,声智科技成立于2016年4月,是一家专注声学前沿技术和人工智能交互的科技创新公司,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案,其中的声学通信、 麦克风阵列 、远场语音唤醒和识别、端到端深度学习等软硬融合技术在产业链条上具有领先优势。
声智科技的核心团队来自于中国科学院,积累了多年的声学和语音识别技术,专注解决当前关键的远场语音交互问题。
对于本轮融资,毅达资本投资总监李丹表示,远场语音交互是最为自然的交流方式,为家庭、车载以及教育、医疗、金融行业带来了非常良好的用户体验。声智科技团队来自中科院、腾讯、杜比实验室等科研机构和企业,凭借深厚的技术积累和优质的服务快速成长为远场声学语音技术和语言智能服务领域的领先者,其技术已广泛应用于华为、小米、百度、阿里、腾讯等消费电子和互联网巨头的产品中。相信随着人工智能和物联网技术的快速发展,社会生活数据化程度的持续加深,声智科技还将迎来更为广阔的发展空间。
智能语音热潮下,提供底层技术支持
目前,全球智能语音产品进入了一个激烈竞争期。在亚马逊推出 智能音箱 Echo之后,谷歌、联想、苹果等也推出了智能音箱;同时国内BAT等推出了以腾讯云小微和DuerOS(度秘)为代表的语音交互系统;小米、京东等也推出了自己的产品。
而在Echo、DuerOS等智能音箱背后,都离不开声学底层技术的支持。
具体来说,一个语音产品方案由前端、云端及内容三部分组成:硬件前端涵括麦克风阵列、降噪算法、芯片、硬件平台等;云端包括 语音识别 和语义理解、语音数据等;内容合作有音乐、天气、短信、通话等应用工具。
相对于更关注与云端语音识别、语义理解等技术的云知声、思必驰等语音解决方案厂商,声智科技更专注于前端的开发和研究,在云端和内容则选择和合作伙伴进行合作。
而在语音方案前端的底层技术主要解决的,就是语音识别、语义理解及语音合成之前的声音拾取优化问题。
声智科技创始人兼CEO陈孝良此前接受采访时曾表示,真实环境下远场语音识别的准确率都差强人意,这主要是因为,语音往往受到噪声、混响、回声等声学因素的干扰,致使输入云端模型的数据丢失大量特征,真实效果远未达到期望,因此最好从底层的声学技术切入去解决这个难题。
提高语音识别率,加速产品落地
看到这一方向,2016年4月,陈孝良带领团队从中科院离职,成立了声智科技,组建了二十多人的技术团队,对前端技术及硬件进行研究。
其研发的回声抵消、噪声抑制、声源定位、混响消除、声音定向等核心技术和麦克风阵列等硬件已经量产应用,这也意味着解决真实场景下远程语音识别与唤醒的思路经过了验证。
据了解,声智科技目前已经将真实场景下的语音识别率从60%提高到了80%左右(中等阈值),随着场景数据量的增长将达到90%以上的识别率。
而在具体业务上,声智科技目前的业务板块主要分为两部分,已拓展到家居、医疗、机器人、汽车、安防、玩具等场景。
第一部分是「给人听的」通话模块。声智科技与360合作的智能故事机业已上线,在智能安防领域,还有360大水滴和小水滴两款产品推出。
第二部分是「给机器听的」语音交互部分。声智科技目前主打智能音箱,在和百度合作推出的DuerOS软硬件一体化解决方案中,就采用了声智科技的6麦克风远场语音交互标准板解决方案。
目前,声智科技已与ARM、NVIDIA、Xilinx、Cypress、Knowles等芯片和器件厂商合作,同时,与于小米、百度、阿里、华为、腾讯、联想、创维、金蝶、浪潮等企业合作,共同构建智能交互产业的闭环生态。
版权声明
本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。