标贝科技粤语语音识别服务上线,助力人机交互更高效
常有人戏称广东人是羊,因为他们无论讲什么,似乎都会用“咩——咩——咩——”作句尾语气词:
“有咩搞作?”(有什么做法、计划?)
“系度做紧咩呀”(现在在做什么呢?)
“系咩?”(是吗?)
这些地道的粤语仿佛自带音效,你即使不精通粤语,看到这几句话都能像模像样地说出来。粤语就像一种流传千年的文化符号,一旦你深入了解粤语,必会佩服它的古朴有趣、博大精深,承载了广府文化强烈的情感认同。
粤语,又称广东话,是中国汉语七大方言之一,全球将近有1.2亿人口使用,在国际影响力和语言的韵味方面,粤语的地位绝对是重量级的老大。
随着AI的飞速发展,应用场景不断扩展,智能语音设备无处不在,对于多语种多口音语音识别的需求也在日渐增加。其中,作为拥有强大号召力的粤语,已成为众多人工智能厂商关注的重点。虽然粤语语音识别需求越来越多,但想要实现精准的粤语识别效果,面临的技术难度也不小。
粤语有多难?
由于承接着古汉语的许多特点,粤语在词汇、语法、发音上都和普通话有明显区别。
词汇上,粤语的日常用语富有特色。虽是口语,却比较“文绉绉”:“喜欢”叫做“钟意”,“厉害”叫做“犀利”,“讨厌”是“乞人憎”,劳驾他人、感谢帮忙,要说“唔该”。粤语的发音就更难了。由于保留了古汉语、古南越语的特色,以及受外语的影响,相对于普通话的四声调,粤语拥有完整的九韵六调,能够组合出的总音节数比普通话还要多。
标贝 科技 粤语语音识别
对于AI语音产品来说,想要提高语音识别的准确性,就需要大量的优质语音数据作为模型训练支撑。面对以上问题及粤语语音识别发展现状,标贝科技此前已经推出一系列粤语语音识别数据集,帮助对识别模型进行优化训练。
近日,标贝科技在融合更多语音和文本的数据采集,以及高精度的数据标注基础上,定制专用语音识别模型,推出高准确率的粤语语音识别服务。
在声学模型方面,通过采集大量真实的粤语录音数据,包括朗读式、自由交谈和命令词等类型,对粤语的发音习惯、声调变化等,进行学习训练,提高模型精度和识别率。
语言模型方面,标贝科技语音识别技术通过对粤语方言中的特有词汇,如“咁”、“哋”、“嘅”、“咩呀”、“点睇”等进行专门训练,有效提升了语音识别引擎对口音、词汇的适配能力。
立足应用场景 助力人机交互更便捷
在移动 互联网 和信息大爆炸时代,无论是从语言角度还是文化角度,我们都不再离群索居,包括人与人的交流、人与机器的交流,多语种和方言的交汇互通已经无处不在。因而,智能语音识别技术成为解决“听不懂”的有效途径。
伴随此次粤语语音识别能力的上线,当前标贝科技可以支持中文、英文、粤语三种语言的语音识别,可以广泛应用于工作、生活、学习多种场景。
在商务会谈中,无论发言人说的是英文、普通话还是粤语,标贝科技语音识别都能对这些发言分角色进行识别,将会议和访谈的音频快速生成会议记录,后期信息检索和整理更方便快捷。
在智能客服领域,客服机器人掌握多个语种,能提高普通话、英文、方言识别的准确率,从而精准识别出用户提出的问题,给予用户最合适的回答,成为真正“听得懂,说的出”的智能客服,提升服务质量。
智能家居场景下,精准高效的语音识别让用户不必再担心因为口音问题出现的错输、漏输问题,随心所欲对各类家居、 家电 语音助手,以及智能机器人、智能可穿戴设备等进行语音控制。
同时,面向 金融 、电商、教育、 媒体 娱乐等行业,我们也推出行业领先的语音合成方案,拥有丰富的语音合成音库,覆盖中文、英文、中英混读、小语种、方言等不同语种。客户可快速选择合适的音色,也可以根据业务场景需求,定制与产品形象相匹配的合成声音,助力语音产品快速落地应用。
未来,随着语音交互技术与智能 手机 、平板电脑、智能家居等电子设备芯片集成的深入发展,将带动智能语音产业迎来更加广阔的发展空间。标贝科技将继续加码研发投入,加速在垂直行业进行渗透和布局,驱动语音合成、语音识别技术继续升级迭代,为消费者创造更优质的交互体验。