新年上新 标贝科技自学习引擎助力语音识别更精确

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

每到岁末年初,总是职场人最忙碌的时候。各种名目繁多的年终总结会接踵而来,小组分享会、部门总结会、公司全员会......参会不可怕,可怕的是,这次轮到谁做会议纪要!要知道这些会议不仅持续时间长,参与人数多,会议录音里很多话根本听不清啊!

但机智如小贝,提前从产品运营小姐姐那里弄来了自家语音识别SVIP权限,无论是线下会议、视频会议,还是 微信 电话等,再长的录音语音文件,一键转换,大份大份的会议纪要新鲜出炉,简直是强迫症的福音有木有!

其实在人工智能飞速发展的今天,随着数据量增加、计算能力增强以及深度学习理论技术的发展,语音识别准确率不断提升,应用领域不断拓宽。不止是会议录音文件转写,语音识别早就成为很多设备的标配。例如,我们可以对着 手机 说“siri,打个电话给老妈”,又或是“小度小度,放首歌”等等。

虽然目前语音识别对于通用场景的语音识别效果较好。但是在一些特定和垂直的应用领域,对于一些专有名字、专业术语、特定的命名实体等识别的准确率却不尽人意。例如 游戏 中有很多专属的说法,“冷静,不要莽”,“不服来Sala(Solo)啊,父子局”、“咱们家没有打野吗”,这些特定的词汇仅使用通用语音识别功能很难将其准确识别。

面对这些语音识别难题,标贝 科技 强大的算法团队自主研发ASR自学习引擎,推出“自学习个性化模型”和“热词”的功能,以提高专属场景下语音识别准确率。


新年上新 标贝科技自学习引擎助力语音识别更精确

01.标贝科技语音识别自学习工具是什么?

目前市场上供应商大多都是提供通用领域的语音识别服务,对应的语言模型为基础语言模型。如果用户需要识别的语音内容不在现有的模型范围内,就会出现部分词汇默认识别效果不好。

通过标贝科技“自学习工具”,在语音识别控制台上传专有领域或行业积累的文本数据,通过对这些训练语料做模型训练,来生成自己的自学习个性化模型和热词模型,可以有效提高专有领域场景下的语音识别准确率,尤其是对专有名词和文本中的高频词汇,有较好的优化效果。

热词:通过标贝开放平台-【热词】功能,将特有的人名、地名、公司名、领域专有词汇(医疗、建筑、 金融 、保险等领域)上传并保存发布,秒级生效。

个性化模型:通过标贝开放平台-【个性化模型】功能,将专有领域或行业积累的具有特点的文本数据上传并保存发布,约5~20分钟后生效。


新年上新 标贝科技自学习引擎助力语音识别更精确

02.标贝科技语音识别自学习工具有什么优势?

便捷接入

标贝科技自学习工具控制台可实现一键配置文本,通过识别接口上传文本参数即可快速生成识别效果,无需更多投入。

快速生效

通过标贝科技自学习工具,只需要上传专有领域的文本信息,热词保存秒级生效,开箱即用,个性化模型最快5分钟即可训练完成,快速响应用户业务。

全领域覆盖

标贝科技自学习工具面向全领域的自学习训练优化,渗透各垂直行业的业务信息即添加即影响,真正打造行业内可快速落地的语音识别技术。

新年上新 标贝科技自学习引擎助力语音识别更精确

03.怎么使用标贝科技语音识别自学习工具?

(1)前往标贝开放平台创建应用,并进入语音识别服务-自学习工具;

(2)进入自学习工具-热词页面,将专有领域和行业积累的文本数据整理保存为UTF-8编码的 txt 文件,点击“新增热词组”,进行热词添加;

(3)获取热词组id,识别调用,测试效果。随着语音技术与智能手机、平板电脑等电子产品芯片集成的深入发展,中国智能语音市场规模将继续保持稳步扩张态势。

语音识别作为人机交互的入口,应用场景会更加广泛。标贝科技将持续加码研发投入,推动语音识别服务继续优化升级,创造更加智能的语音交互体验。

目前标贝科技语音识别【自学习工具】已经在官网和标贝开放平台上线,免费对客户开放。欢迎登录标贝开放平台体验。

随意打赏

提交建议
微信扫一扫,分享给好友吧。