2018AI开发者大会:推进语音事业发展,标贝科技首次免费开放TTS数据库
2018年11月8至11日,由中国IT社区CSDN与硅谷AI社区AICamp联合举办的2018 AI开发者大会在北京盛大召开,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、 标贝科技 、第四范式等国内外领军企业的60余位一线技术大咖将带来一场技术头脑风暴。
据悉,本次大会也是本年度 人工智能 领域面向专业开发者的一次高规格技术盛会,议题涉及多个AI领域,包括知识图谱、机器学习、智慧金融、自然语言处理、语音技术、计算机视觉、数据分析等,对我国人工智能产业的发展和技术应用的深入落地有着极大推动作用。
在语音技术专题演讲上,扎根该领域国内明星创企出门问问、云知声、标贝科技等公司分别在远场语音交互、声纹识别、AIoT 智能交互等不同细分技术领域讲述了技术实践、应用实践以及现阶段遇到的技术瓶颈,并给出了可能的解决方案。
“AIoT”即“AI+IoT”,指的是人工智能技术与物联网在实际应用中的落地融合。当前,已经有越来越多的人将AI与IoT结合到一起来看,AIoT作为各大传统行业智能化升级的最佳通道,已经成为物联网发展的必然趋势。
在基于IoT技术的市场里,与人发生联系的场景(如智能家居、自动驾驶、智慧医疗、智慧办公)正在变得越来越多。而只要是与人发生联系的地方,势必都会涉及人机交互的需求。而随着智能终端设备的爆发,用户对于人与机器间的交互体验也提出了全新要求——机器声音更自然,更像真人,使得语音合成(TTS)市场被逐渐激发起来。
在标贝科技联合创始人&CTO李秀林看来,语音合成技术作为一项有着悠久历史的技术手段,近两年所运用的技术更新发展得非常快。特别是在今年,端对端技术与神经网络声码器相结合的运用对合成语音的可懂度和自然度有了质的提升,以标贝科技为代表的智能语音企业得以为更多企业找到落地场景。
据悉, 标贝科技 甚至打造了一个“声音超市”,为合作伙伴提供了一个可供选择的,所听即所得的声音平台,助力智能产品向“人性化”发展。
根据语音合成的实践现状: 端到端实际控制难、语音数据少、GPU价格高 三大问题,李秀林也提出了解决方案。首先,将输入维度从数万维降为数十维,降低控制难度。其次,充分利用文本数据,构建前端模块,并选择合适的声码器,降低运算量,以此推动语音合成的应用成本降低、应用领域不断向纵深发展。
同时,李秀林在大会上宣布: 标贝科技首次免费开放语音合成数据库 ,数据规模达到10000句,总时长约12小时,以支持非商业用途的学术研究,与行业携手推进语音事业的发展。
此次数据开放的决定得到了大会参与者和同行业的一致高度赞扬。标贝科技认为,在目前这一阶段下, 降低数据获取难度 可以推动技术的更新迭代,当更多应用场景涌现、社会效益显现时,语音合成才会真正爆发出巨大的能量。
数据获取方式:
关注标贝科技微信公众号(biaobeikeji),直接下载数据包
一直以来,技术都是推动商业环境进化的重要因素,而目前最热的技术升级趋势,无疑是人工智能。当下,尽管人工智能行业本身已经进入了一个平稳的发展期,但它对于各行各业的赋能却正在以更热烈的姿态进行。
2018年11月30日上午,亿欧将在北京国贸大酒店举办“新技术·新动能创新者论坛”,以技术为核心要素,从行业角度出发,探讨新技术趋势下,企业如何把握升级机会、跟上时代节奏,在诸多竞争者中脱颖而出。
详情及报名链接:
https://www.iyiou.com/post/ad/id/730
版权声明
凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。