ICASSP 2022 |快手联合发起的深度3D音频信号处理挑战赛成绩正式发布
近日,由快手音视频技术部联合意大利罗马第一大学(Sapienza University of Rome, Italy),在国际音频顶级会议 ICASSP 2022 上发起的深度3D音频信号处理挑战赛(L3DAS22:Machine Learning for 3D Audio Signal Processing)成绩正式发布。此次比赛共有来自全球近50支学术界和工业界团队报名,比赛成果将在今年5月 ICASSP 2022 大会的 Special Session 上进行分享。
作为第一届L3DAS21比赛的冠军,快手音视频技术部音频算法团队在深度学习的音频信号处理方向上持续探索。此次团队联合意大利罗马第一大学发起挑战赛,旨在提供一个通用的数据集和公平的测试平台,促进真实场景下3D深度音频信号处理核心技术的研究。基于深度学习的3D音频信号处理技术引起学术界和工业界广泛关注,在虚拟和真实会议、 游戏 开发、音乐制作,自动驾驶及监控等领域深入应用。相较于单通道音频,3D音频携带的增量三维声源方位信息,有助于提升语音和情感识别、声源分离、语音增强和去噪,以及声学回声消除算法的效果。
本次挑战赛共设置了两个任务:
任务一:多通道3D语音增强任务,专注于办公场景下的实时语音增强需求。
任务二:真实场景下特定声源检测和定位任务,专注于自动驾驶、监控等应用场景。
图1:任务一: 语音增强比赛成绩
图2:任务二:声源检测及定位比赛成绩
快手音视频技术部汇聚了音频领域顶尖人才,结合快手业务推进了前沿算法的应用和落地,深入实时语音通信、音频音效及后处理、音频内容理解、音频编解码、音频硬件等多个领域。团队成员在IEEE ICASSP、Interspeech、ACM/IEEE TALSP等顶级学术会议和期刊上,均有发表系列学术论文,并多次斩获音频挑战赛冠军。