国际顶会ACL 2020上的大动作!百度领衔举办首届同声传译研讨会
近日,国际顶会ACL官网披露大会议程,由百度领衔,联合Google、Facebook、Upenn、清华大学等海内外顶尖企业及高校专家们共同申办的首届同声传译研讨会(The 1st Workshop on Automatic Simultaneous Translation),将在自然语言处理领域国际顶级学术会议ACL 2020中召开。研讨会期间,百度还将举办国际首届同传评测,以进一步促进技术交流与发展。
众所周知,国际计算语言学协会(ACL,The Association for Computational Linguistics)成立于1962年,是自然语言处理领域影响力最大、最具活力的国际学术组织之一,自成立之日起,致力于推动计算语言学及自然语言处理相关研究的发展和国际学术交流。一直以来,百度积极参与各届ACL顶会,引发行业瞩目,ACL 2019中百度更是有十篇论文被收录,涵盖诸多热点和前沿研究方向。百度CTO王海峰博士则是ACL五十多年历史上首位华人主席,ACL Fellow,并于2018年出任ACL亚太分会(AACL)创始主席。此次在ACL 2020由百度领衔举办首届同传Workshop,无疑是对其在NLP领域技术实力和国际影响力的极大认可,其行业“头雁”的角色再次显露。
同声传译历来是自然语言处理领域的经典课题。同声传译是指在不打断演讲者的条件下,将讲话内容不间断地、实时地翻译给听众的一种翻译方式,广泛应用于国际会议、外交谈判、商务会谈等重要场合。
近年来,随着人工智能相关技术的进步,结合了机器翻译(MT)、语音识别(ASR)和语音合成(TTS)等技术的机器同传(Simultaneous Translation,ST)成为领域前沿。其中,既有技术突破如集成预测和可控时延的同传模型、语义信息单元驱动的上下文同传模型等,也有广泛的产品应用,如字幕投屏、语音到语音的同传小程序等。然而,作为一个融合多种技术的前沿课题,机器同传仍然面临国际公认的诸多挑战,如语音识别错误传播、翻译模型鲁棒性差、数据稀缺、评价体系不健全等。
为了推动同传技术的发展,百度联合国内外顶尖企业和高校共同举办国际首届同声传译研讨会,汇集包括机器翻译、语音处理和人类口译领域的研究人员和从业人员,共同讨论同声传译的最新进展、面临的挑战以及未来发展。
在本次研讨会中,国际首届同传评测比赛也将同期举办。赛事的含金量非常高,包含中英、英西3种语言、两个翻译方向。作为首届针对同声传译的顶级专业赛事,此次百度将行业首发超过70小时的高质量真实场景演讲语音及标注结果供参赛者进行模型训练,涵盖信息技术、 经济 、文化、生物、艺术等多个领域。众所周知,高质量的数据是同声传译研究中面临的重要问题。参赛者经过报名审核后,百度将定向开放该数据集,这无疑将为开发者们提供珍贵的数据环境。此外,赛事共将提供4个赛道,综合评估各参赛队伍的翻译质量和延时情况,当前赛事已开放报名。
同时,基于百度深度学习平台飞桨的一站式AI开发实训平台百度大脑AI Studio,百度还将为参赛选手提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。
我们期待,此次ACL 2020同声传译研讨会将为学界、业界激荡出全新火花!