从国际母语日到母语开放周,看科大讯飞多语种技术的系统性创新
“若用一个能够理解的语言和他交谈,你可以言之以理;若用一个人的母语和他交谈,你可以动之以情。”人栖居于语言中,其中,母语的意义尤为特殊。她是人们最初的表达工具,是交织着故土、人情与血脉的载体,更是世界历史与文化发展的根基。
全球现存有7000余种语言,其中至少有43%是濒危语言,每两周就有一种语言消逝,随之逝去的还有这门语言背后蕴含的整个文化和知识遗产。语言的多样性正面临着严峻的挑战。
每年的2月21日是联合国教科文组织设立的国际母语日,旨在促进语言和文化的多样性。“利用技术促进多语言学习:挑战与机遇”是2022年国际母语日的主题。2月21日-27日,科大讯飞开放平台为此特别策划了首届「母语开放周」活动,用AI技术促进多语言沟通的包容与共生。
为了让更多开发者用户体验多语种智能语音语言技术,首届「母语开放周」带来“讯飞AI社区”与微博等平台有奖话题互动、“45分钟小课堂”多语种技术与应用的解读分享、多语种能力大促销等活动。借此机会,科大讯飞开放平台希望与更多开发者用户共同关注多语种智能语音语言技术在促进多语言沟通无障碍上的应用前景。
多语种语音语言技术是万物互联时代实现人机交互的关键技术,也是实现一带一路语言大互通的基础技术。从数据、算法、平台等多维度,近几年科大讯飞在多语种智能语音语言技术系统性创新中不断取得突破。
在Voice Conversion Challenge2020 国际音色转换大赛中,科大讯飞与中科大语音及语言信息处理国家工程实验室联合提交的系统,在「同语种转换」与「跨语种转换」两项任务上摘下8项指标7项第一,成功卫冕。这意味着通过科大讯飞研发的跨语种转换技术,用户面对不同语种的友人都可以用自己的原声来交流。
在2021年11月由美国国家标准与技术研究院NIST举办的国际低资源多语种语音识别竞赛OpenASR上,科大讯飞展现了在低资源多语种语音识别技术上的实力,凭借着基于语音和文本统一空间表达的半监督语音识别框架一次拿下所有15个语种受限赛道和7个语种非受限赛道的第一名。
刚落幕的北京2022年冬奥会,科大讯飞作为官方自动语音转换与翻译独家供应商,提供了自动翻译和相关的多语种语音转换、语音识别以及语音合成等硬核技术,助力实现赛场内外的沟通无障碍。
多语种智能语音语言技术的进步,既有力支撑了讯飞翻译终端、智能录音笔、讯飞听见多语种字幕同传系统等 智能硬件 产品不断创新,同时科大讯飞开放平台也积极为 家电 、 手机 、车载交互等行业场景提供自主可控解决方案,助力出海企业开拓国际化市场。
推进技术与场景深度融合应用,目前科大讯飞研究院已完成一套完整的多语种语音语言系统研发,包括60种语言的语音合成,69种语言的语音识别,56种语言的图文识别,以及168种语言与中文的机器翻译。部分语种现已上线科大讯飞开放平台,为开发者与企业用户提供简单易用的AI能力服务。
同时,在新加坡、俄罗斯、印度、日本等国家部署了海外站点,通过科大讯飞开放平台持续为全球开发者提供语音识别、语音合成、机器翻译、图文识别等智能语音服务,致力于依托先进的多语种技术为企业、用户提供服务支持,促进多语言沟通的包容与共生。