新能力|标贝科技语音合成支持数理化公式等复杂数字符号的自然朗读
“哪里不会点哪里,妈妈再也不担心我的学习了,so easy!”
当年这段广告词可谓洗脑神句传遍大江南北,点读机作为教育场景的典型电子产品,也一度风靡市场。
随着AI技术在教育场景的广泛应用,特别是语音交互技术丰富了学生上课体验形式。以点读机、学习机、甚至AI虚拟老师等为代表的教学方式也越来越普及。让在线教育更加智能化、个性化,有效解决了学生们差异化的学习需求。
目前,语音合成已经进入较为成熟的发展阶段,在教学内容生产方面,可以增加配课、点读等有声教学素材,甚至可以取代部分真人对话的教育内容,大大降低教学配音的成本和周期。
例如,在语文、英语等语言学习科目中,AI虚拟老师可以通过教学视频和语音合成,生成虚拟教学内容,缓解线下教师的工作压力;学生则借助智能学习设备,扫描自己想要学习的文字或短语,听取正确的发音和语调,跟着模仿发音。
但是在数理化等科目里涉及到公式的读法时,大部分语音合成软件存在一定的难度。对于较为简单的,如数学中的加减乘除、开方、指数、三角函数等,一般语音合成软件通常可以给出正确的读法。而对于复杂的如物理、化学等领域的公式,由于这些公式中可能包含大量的特殊符号、单位和上下文信息等,需要逐字进行转换,耗费时间且准确率较低。
为了完善AI教育应用场景,标贝 科技 通过语音合成前端语言模型优化,实现了语音合成技术对Latex数理化公式朗读的支持,提供更好的教学体验。
什么是Latex?
LaTeX是一种基于TeX的排版系统,由美国计算机科学家莱斯利·兰伯特在20世纪80年代初期开发。 MathJax是一个跨浏览器的JavaScript库,它使用MathML、LaTeX和ASCIIMathML标记在Web浏览器中显示数学符号。
举例↓:
latex公式:
实际页面展示的公式:
标贝科技基于LaTeX公式的基本组成单元和语法规则,依托精确的词法分析和深入的句法分析技术,将复杂的LaTeX公式拆解为最细粒度的词法单元,然后将这些单元映射为能准确反映LaTeX公式层次结构的抽象语法树(AST)。
接着再建立一套规则,用于将LaTeX公式中的符号、元素和命令翻译成自然语言。通过在AST上进行遍历并应用这些翻译规则,最终成功实现从LaTeX公式到自然语言的转换。
目前,标贝科技语音合成技术能够以通俗易懂的方式朗读 LaTeX 公式,覆盖从小学到初中12年教科书中涉及到的数学、物理、化学公式。同时标贝科技还可以根据客户具体需求,定制高中及其他复杂数据符号的科目。
标贝科技 前端语言模型优化定制方案
在语音合成技术中,前端语言模型主要负责对输入到语音合成系统的文本进行分析,并提取发声和韵律特征,以便声学模型根据这些特征生成对应的语音信号,是处理和生成语音信号的重要环节之一。
前端语言模型通常有一些通用方案,但是在不同的业务任务和数据特点下,通用方案无法直接将文本转化为可合成的语音信号时,就需要对前端语言模型进行改进和优化。
标贝科技可以提供前端语言模型优化定制方案,将文本中复杂的数字、符号、缩写等转换成语言文字,客户无需做二次转换,即可获得准确的发音,提高模型的性能和效果。
例如,除了支持以上LaTeX 公式类的朗读外,标贝科技还可以通过前端语言模型优化定制方案,输出对 手机 型号或者各类机器设备型号的正确读法。欢迎新老用户咨询体验!