NLP≠NLU,机器学习无法理解人类语言
编译 | 吴彤
校对 | 青暮
编辑 | 琰琰
长期以来,我们一直在与机器沟通: 编写代码--创建程序--执行任务 。
然而,这些程序并非是用人类“自然语言“编写的,像Java、Python、C和C ++语言,始终考虑的是"机器能够轻松理解和处理吗?"
“自然语言处理”(Natural Language Processing,NLP)的目的与此相反, 它不是以人类顺应机器的方式学习与它们沟通,而是使机器具备智力,学习人类的交流方式 。其意义更为重大,因为技术的目的本来就是让我们生活得更轻松。
人工智能与子领域
自然语言处理,实际上是人工智能和语言学的交叉领域,但多年来,仅在语音转录、语音命令执行、语音关键词提取的工作上兢兢业业,规规矩矩,应用到人机交互,就显得十分吃力。
因为在语料预处理阶段,NLP通常直接给出“断句”,比如 "订一张明天从北京到杭州的机票,国航头等舱",经过NLP模型处理后,机器给出的输出如下:
尽管准确率高,但在这背后,我们并不知道机器理解了什么。由于足够好用,人们也就不多问了。
而在更加复杂的任务中,比如机器翻译,基于深度学习的编码、解码架构会将原句子转换成我们根本不熟悉的样子,也就是在无穷维空间中的点。
一旦机器翻译出错,我们打开这个空间的时候,才发现这些点和周围其他点(其他句子)构成的形态,犹如荒芜宇宙里零落的星星那样缥缈和神秘。
研究人员试图向神经网络添加参数以提高它们在语言任务上的表现,然而,语言理解的根本问题是“理解词语和句子下隐藏的含义“。
近日,伦斯勒理工学院的两位科学家撰写了一本名为 《人工智能时代语言学》 的书, 探讨了目前的人工智能学习方法在自然语言理解(Natural Language Understanding,NLU)中的瓶颈,并尝试探索更先进的智能体的途径。
AI必须从“处理”自然语言到“理解”自然语言
机器“记录”了数据并不意味着“理解”了数据。 近几十年来,机器学习算法一直尝试完成从NLP 到 NLU 的转型。过去,机器学习曾长期承载着转型使命的荣光。
机器学习模型是一种知识精益系统,它试图通过统计词语映射来回答上下文关系。在这些模型中,上下文是由词语序列之间的统计关系形成的,而非词语背后的含义。自然,数据集越大、示例越多样化,机器对上下文关系的理解越精确。
但作者认为, 机器学习终将失宠,因为它们需要太多的算力和数据来自动设计特征、创建词汇结构和本体,以及开发将所有这些部分结合在一起的软件系统 。而且,机器人也不知道自己在做什么,以及为什么这样做。它们解决问题的方法不像人类--不依赖与世界、语言或自身的互动。因此,它们无法理解两个人长时间对话时,对同一件事情的描述越来越简短的情景,也就是文本缺失现象。
巨大人工成本使机器学习陷入瓶颈,并迫使人们寻求其他方法来处理自然语言, 并导致了自然语言处理中经验主义范式(认为语言理解起源于感觉)的出现。
具有“感觉”的人工智能,或许会在自然语言处理上有三个突破:
-
通过语言交流激活感觉模型,并以此承载记忆,从而可以应对人类之间交流时的文本缺失现象,实现“默契”(正确)的解码;
-
理解语言的上下文相关含义,并从单词和句子的歧义中找到合适的理解,以及从感觉世界中寻找更强的约束和限制;
-
向它们的人类合作者解释它们的想法、行动和决策;
与人类一样,机器也需要在世界互动时保持终身学习。而机器学习由于将可压缩性和可学习性对等起来,并且限于表面的符号统计关系理解,以及不可解释性等原因,不可避免丢失背景信息,而做不到上述层次的理解。
总之, 机器要理解自然语言,感觉经验是必不可少的。 这与 Jürgen Schmidhuber在虚拟的游戏环境中设计的智能体是类似的逻辑,研究人员不会让智能体学习局限于单一的决策输出,而是逐步通过与虚拟世界互动,首先建立对虚拟世界的表征模型,再基于表征模型去进行决策。
正如 McShane 和 Nirenburg 在他们的书中指出的那样,“ 语言理解不能与整体的认知过程区分开来,启发机器人理解语言也要运用其他感知(例如视觉、触觉)。 ”正如在现实世界中,人类也是利用他们丰富的体态动作来填补语言表达的空白。
1
经验和数据驱动的革命
20世纪90年代初,一场统计革命席卷了人工智能 (AI),并在 2000 年代达到高潮。神经网络化身为现代深度学习 (DL) 凯旋归来,并席卷了人工智能的所有子领域。尽管深度学习最具争议的应用是自然语言处理 (NLP),但仍旧带来了经验主义的转向。
NLP 中广泛使用数据驱动的经验方法有以下原因: 符号和逻辑方法未能产生可扩展的 NLP 系统,导致 NLP (EMNLP,此指数据驱动、基于语料库的短语,统计和机器学习方法)中所谓的经验方法的兴起。
这种向经验主义转变的动机很简单:在我们深入了解语言如何运作以及如何与我们口语谈论的内容相关之前,经验和数据驱动的方法可能有助于构建一些实用的文本处理应用程序。
正如EMNLP的先驱之一肯尼思·丘奇(Kenneth Church)所解释的,NLP数据驱动和统计方法的拥护者对解决简单的语言任务感兴趣,其动机从来不是暗示语言就是这样运作的,而是"做简单的事情总比什么都不做好"。
丘奇认为, 这种转变的动机被严重误解,他们以为这个“可能大致正确的”( Probably Approximately Correct ,PAC)范式将扩展到完全自然的语言理解。
“新一代和当代的NLP研究人员在语言学和NLP的理解上有差别,因此,这种 被误导 的趋势导致了一种不幸的状况:坚持使用"大语言模型"(LLM)构建NLP系统,这需要巨大的计算能力,并试图通过记住海量数据来 接近 自然语言。
这几乎是徒劳的尝试。我们认为,这种伪科学方法不仅浪费时间和资源,而且引诱新一代年轻科学家认为语言只是数据。更糟糕的是,这种方法会阻碍自然语言理解(NLU)的任何真正进展。
相反,现在是重新思考 NLU 方法的时候了。因为我们确信, 对 NLU 的"大数据"方法不仅在心理上、认知上甚至计算上都是难以操作的,而且这种盲目的数据驱动 NLU 方法在理论和技术上也有缺陷。
2
语言处理与语言理解
虽然 NLP(自然语言处理)和 NLU(自然语言理解)经常互换使用,但两者之间存在巨大差异。事实上,认识到它们之间的技术差异将使我们认识到数据驱动的机器学习方法。 虽然机器学习可能适合某些 NLP 任务,但它们几乎与 NLU 无关。
考虑最常见的"下游 NLP"任务:
综述--主题提取--命名实体识别(NER)--(语义)搜索--自动标记--聚类
上述所有任务都符合所有机器学习方法的基础可能大致正确(PAC) 范式。具体来说,评估一些NLP系统在上述任务的性能是相对主观的,没有客观标准来判断某些系统提取的主题是否优于另一个主题。
然而, 语言理解不承认任何程度的误差,它们要充分理解一个话语或一个问题。
举个例子,针对这句话,自然语言理解就需要考虑多种可能: 我们有一个退休的BBC记者,曾在冷战期间驻扎在一个东欧国家吗?
某些数据库对上述查询将只有一个正确的答案。因此,将上述内容转换为正式的结构化查询语言查询是巨大的挑战,因为我们不能搞错任何错误。
这个问题背后的"确切"思想涉及:
-
正确解释"退休的BBC记者"——即作为所有在BBC工作的记者,现在退休了。 -
通过保留那些在某个"东欧国家"工作的"退休BBC记者",进一步过滤上述内容。
-
以上意味着将介词短语为"在冷战期间",而不是"一个东欧国家"(如果"冷战期间"被替换为"具有华沙成员资格",就要考虑不同的介词短语') -
做正确的量化范围:我们正在寻找的不是在 "一些" 东欧国家工作的记者, 而是“任何” 在“任何” 东欧国家工作的记者。
3
为什么 NLU 很困难:文本容易丢失
2.演讲者多做一部分工作,把所有想要传达的思想信息告诉听者,减少听者的工作量;
机器可学习性(ML) 和可压缩性(COMP)之间的等价性已在数学上建立 。即已经确定,只有在数据高度可压缩(未压缩的数据有大量冗余)时,才能从数据集中学习,反之亦然。
机器学习是关于发现将大量数据概括为单一函数。另一方面,由于MTP,自然语言理解需要智能的"不压缩"技术,可以发现所有缺失和隐含的假定文本。因此, 机器学习和语言理解是不兼容的——事实上,它们是矛盾的。
奖杯不适合在手提箱,因为它是太 : 1a.小 ;1b.大
4
结束语
https://thegradient.pub/machine-learning-wont-solve-the-natural-language-understanding-challenge/
雷锋网雷锋网雷锋网 (公众号:雷锋网)
雷锋网特约稿件,未经授权禁止转载。详情见。