下一届喜剧大师会是机器吗?Stanford研究员在努力训练神经网络理解人类的俏皮话和双关语
公众号/将门创投
From: Wired 编译: Ace
相信很多朋友在尝试调戏Siri、小冰等AI助手时,应该都获得过令人捧腹大笑的回答,Siri甚至一度荣获“最佳段子手”称号。但是当你尝试对它们使用一些连人类都得思考一会儿的双关语时,他们往往就只能无奈回答“抱歉请您再说一遍”了。创造性语言,尤其是具备基本的幽默感,是人工智能目前仍难以逾越的瓶颈之一。有些研究者认为无法理解幽默感是人工智能与人类在自然交互上面临的最大障碍。近日,斯坦福大学的一个华人研究团队结合神经网络与心理语言学,提出了以surprise为核心的神经网络双关语训练方法。
神经网络作为一项自带模仿属性的技术,通过大量文本来学习人类的语言模式,对于一致性问题,这种方法比较行得通。不过问题来了,学得好并不意味着有意思。举个栗子,“该不该在新闻内容生产方面大量使用AI”一直是个比较热议的话题。但即使AI可以通过学习产生令人信以为真的新闻,由此产生的内容基本就会和训练它们的维基百科、严肃文学一样令人索然无味,抛开“AI撰写新闻”的噱头,其内容本身可能未必能够抓住人们的眼球。也就是说,神经网络遵守规则,但却不太擅长讲笑话、抖包袱。
所以,斯坦福大学的研究团队的目标是创造出一款真实自然、生动有趣的机器人,不仅是可以播报新闻、预报天气的“播音员”,还能成为既会get到笑点、又会写诗的“文艺青年”,甚至还能讲述一个引人入胜的故事。
不过这并不容易。
先来看看下面这句话:
The greyhound stopped to get a hare cut.
Google把它翻译成“灰狗停下来砍兔子”???没看懂这句话不要紧,这不是你的问题,要怪就怪计算机还没完全理解人类语言中的双关语。
该研究团队认为一个精心设计的笑话在把握一个巧劲儿,会在一致性与合理性之间达到平衡,又不会完全无厘头。此外,创造性语言的核心是新颖,而不是循规蹈矩。如何赋予神经网络创意?这就对研究人员提出了更高的要求,“即使我们有一长串的双关语供它学习模仿,但终究比不过具有独创性的内容生产 。”上面的例子就说明了这一点。
如何走出这个死循环呢?斯坦福的研究团队试图利用有关“幽默”的理论赋予他们的AI一些创造性的智慧,即教会AI什么是“幽默感”。大多数研究者都认为幽默的产生和理解都与感知到的失谐(Incongruity)有关,即有别于心理常规,出现和期望不同或相反的因素,也就是让感受者感到惊讶的因素(surprise)。
为了使双关语起作用,斯坦福的研究团队认为应该在具体的语言环境(local context)中制造出其不意的效果。上面那个例子中stopped to get a hare cut就其本身来说没有太大意义,团队决定借鉴一些学术理论来解决这个难题:关于惊讶的“局部-全局原理”(local-global surprisal principle)。为了生成双关语,神经网络被赋予一对同音异义词(hair头发/hare野兔),基于第一个单词hair生成一个句子,但是当第二个单词hare替换掉hair时会让人摸不着头脑,之后它会插入另一个带有hare的句子,使整个句子更加逻辑。
为了验证这种方法是否可行,研究团队还举行了一场双关语竞赛,让AI与人类幽默大师PK,大众评委对其进行评分。按人类的标准来说,机器人的表现不算很好。虽然这个AI系统生成的双关语比以往的更加“幽默”,但在比赛中它战胜人类的机率只有10%。有时它生成的双关语会卡在一个基本结构中,语法还会发生错乱。比如说:
That’s because negotiator got my car back to me in one peace.
Even from the outside, I could tell that he’d already lost some wait.
Well, gourmet did it, he thought, it’d butter be right.
(下划线处是我们认为有bug的地方,欢迎大家在评论区施展拳脚一起debug)
尽管研究人员称暂时无法解决这个问题,麻省理工学院计算心理语言学实验室主任Roger Levy表示,构建双关语神经网络对于建立更人性化的AI来说是很振奋人心的一步。“尽管赋予机器人类的幽默感非常具有挑战性,但这也是我们之所以成为人类的基础。”
四年前,Levy尝试了用一种计算方法来表示并判断双关语是否有趣,这也是斯坦福研究团队笑话生成方法(joke-generation)的基础。他也希望可以借鉴local-global surprisal principle的概念,来完成比他论文更精确的测试,虽然目前还没有数据证明这一概念的可行性,但“如果真的可以用这个思路成功实现双关语的测试,想想就是一件很酷的事情!”
从更大的层面来看,幽默感研究的困境恰恰也强调了为神经网络赋予更多人类智慧的必要性。最近,他尝试用“surprise”作为研究AI如何理解语言的方法。Levy认为,不论在人工智能还是认知科学领域,surprise都是核心的概念之一。对于人类来说,surprise反映为我们遇到事情的反应,这是可以测量的,比如跟踪我们在阅读时的眼球运动。在机器中,surprise的程度可以用概率测量:在给定的上下文中出现概率较低的词更令人感到惊讶。
这就使得surprise成为一种比较人类大脑和机器如何通过语言推理的有效指标——探索各自黑盒子内部运作的方式。Levy也发现,当把神经网络放到研究人类如何处理模棱两可的语言的一系列心理语言学(psycholinguistic)测试中时,对计算机以非人类的方式“出人意料”展现出来的内容进行调整,这些差异可能也会是设计具有更人性化行为的AI的关键。
与此同时,斯坦福的研究团队还希望将其研究的双关语方法应用于更复杂的场景,让AI完成更具创造性的任务,比如编故事。这个想法是让神经网络做它擅长的事情,然后再结合人类的智慧二次加工。打个比方,训练神经网络先生成一连串完美连贯的句子,然后再根据人类的叙事理论进一步写出一部具有一定创意的短篇小说。“我们的目标倒不至于一定要求训练神经网络具备理解和生产双关语的能力,我们更希望让AI摆脱我们固有的套路和框框,写出更具创意和趣味的故事。”
文中提及的双关语方法论文可以参见:
https://www.groundai.com/project/pun-generation-with-surprise/1