雷锋网 AI 科技评论按:人类很擅长在嘈杂的环境下将其他非重点的声响「静音」化,从而将注意力集中在某个特定人物身上。这也就是众所周知的「鸡尾酒会效应」,这种能力是人类与生俱来的。然而,自动化语音分离系统—将音频信号分离至单独的语音源—尽管这是一个已经被深入研究过的问题,但是它依旧是计算机系统研究上的一项巨大挑战。Goo
或许这也是一种方法论:当针对一个问题有多种方法时,不妨将它们综合起来,或能取各家之长,补各家之短。本文所要介绍的工作正是采用了这种思路,在语音识别的鸡尾酒会问题上取得了较大的突破。雷锋网(公众号:雷锋网)
AI 科技评论按:近日来自 Microsoft AI and Research 的研究员在 arXiv 上