深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

搜狐科技 • 9年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

选自EMNLP

机器之心编辑整理

参与：杜夏德、李泽南、李亚洲、吴攀

今年的自然语言处理实证方法会议（EMNLP 2016）正在（11 月 1 日-5 日）美国德克萨斯奥斯汀市举行。作为自然语言处理领域的顶级大会，EMNLP 一直以来都在为自然语言处理的发展提供强大的助力。在此文中，机器之心整理了大会的最佳论文、荣誉论文、最佳短篇论文和最佳资源论文。此外，还把 Chris Dyer 等三人在大会上做的一个 tutorial 演讲《Practical Neural Networks for NLP》作为资源分享给大家，该 tutorial 较为全面地覆盖了用于自然语言处理的神经网络的基础，是自然语言处理入门的必备良品。机器之心还整理了相关论文和幻灯片，读者也可点击文末「阅读原文」下载。

第一部分：获奖论文

本届 EMNLP 一共选出了 6 篇获奖论文，包括 2 篇最佳论文、2 篇荣誉论文、1 篇最佳短篇论文和 1 篇最佳资源论文。下面是对这 6 篇论文的摘要介绍。

最佳论文 ：

1.Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

摘要：大部分成功的信息提取系统运行时都接入一个大型的文件集。在这个研究中，我们探索了获取并结合外部证据的任务，以在训练数据量稀缺的领域中提高提取的精确度，这个过程需要重复发布搜索查询，从新的来源中提取以及使提取值一致，直到收集到足够的证据。我们使用强化学习框架来解决这个问题，在此框架中，我们的模型可以学习基于上下文来选择最优行动。我们应用了一个深度 Q-network，训练它来优化能反应提取精度同时还能惩罚多余工作的奖励函数。我们的试验用到了两个数据库――枪击事件数据和食品掺假情况数据――证明了我们的系统明显优于传统的提取器和一个元分类基准。

2.Global Neural CCG Parsing with Optimality Guarantees

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

摘要：我们介绍了第一种全局递归神经解析模型，它是实时解码的最佳保证。为了支持全局特性，我们放弃了动态程序，用直接在所有可能子树中搜索的方式代替。尽管这样会导致句长指数性地增长，我们展示了达到学习效率 A 解析器的可能性。我们增大了已知解析模型，它存在外界评分的信息界限，通过一个宽松界限并只需非局性现象建模的全局模型。全局模型因此在新的目标下进行训练，这可以鼓励解析器更精确有效地进行搜索。这种方式适用于 CCG 解析，通过 0.4F1 获得了可观的精确性提升。解析器可为 99.9% 的停止句（held-out sentence）找到最佳解析，仅需搜索平均 190 个子树。

最佳论文荣誉提名：

1.Span-Based Constituency Parsing with a Structure-Label System and Provably Optimal Dynamic Oracles

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

摘要：由于神经网络的出现，使用有效的转换系统的解析精确度已得到巨大提升。尽管依存关系语法分析的结果惊人，神经模型还没有超过 constituency 分析中的最佳方法。为了弥补这个缺陷，我们引进了一个新的位移减少系统，该系统的堆栈只包含了句子跨度，通过最低限度的长短期记忆网络特征来表征。我们还为 constituency 分析方法设计出首个可查验的最优的 dynamic oracle，相比于进行依存分析的 O(n3)oracles，它在 amortized O(1)time 内运行。在此 Oracle 上训练，我们在英语和法语中任何不适用 reranking 和外部数据的解析器上，都取得了最好的 F1 得分。

2.Sequence-to-Sequence Learning as Beam-Search Optimization

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

摘要：Sequence-to-Sequence（seq2seq）建模已经成为了一种重要的多用途自然语言处理工具，它已被证明在很多文本生成和排序任务中被证明有效。Seq2seq 建立在深度神经语言建模之上，并在局部的下一个词分布的估计中延续了其良好的精确度。在本研究中，我们介绍了一种模型和训练方式，基于 Daum'e III 和 Marcu（2005）的成果，同时扩展了 seq2seq 方式，使它可以学习全局序列分数。这种结构方式在证明了已有 seq2seq 模型架构能够进行有效训练的情况下，避免了传统方式上局部训练（local training）的常见偏差，同时通过测试使用时间使训练损失一致。我们发现与高度优化的基于注意的 seq2seq 系统以及其他系统相比，在三种不同的 sequence to sequence 任务中（词序，解析和机器翻译），我们的系统存在明显优势。

最佳短篇论文：

Learning a Lexicon and Translation Model from Phoneme Lattices

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

摘要：语言文件始于对语音的收集。在词上的手动或自动转录几乎不可能实现，因为缺乏正字法（orthography）或先前词汇，而且尽管手动音素转录是可能的，却相当的慢。此外，将小语种转译为主要语言更容易掌握。我们提出一种方法能掌握这样的翻译技能，从而改进自动音素识别。该方法假设没有先前词汇或翻译模型，而是从音素网格和被转录的语音翻译中进行学习。实验表明在两个基线上对音素错误率有了极大改进，也改进了该模型学习有用双语词汇入构项的能力。

最佳资源论文：

SQuAD: 100,000+ Questions for Machine Comprehension of Text

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

摘要：我们展现了斯坦福问答数据集（SQuAD），这是一个新的包含 10 万条问题的阅读理解数据集，由众包工作人员在一系列 Wikipedia 文章上提出，面向每个问题的答案是相应阅读文章的分割文本。我们分析了该数据集来理解回答这些问题所需的推理类型，及其依赖 dependency 和 constituency 树。我们建立了一个逻辑回归模型，取得了 51% 的 F1 得分，这是对基线成果（20%）的极大改进。然而，人类水平却更高（86.8%），表明该数据集展示了未来研究的一大挑战。数据集免费开放地址： https://stanford-qa.com/。

第二部分：自然语言处理实际应用的神经网络

语言是离散的和结构化的，可以用序列、树、图来表示。神经网络以连续的向量表示，天生缺乏结构性。所以神经网络进行自然语言识别的最大的挑战是：如何在语言和神经网络不同结构间进行合理的转换。Chris Dyer、Yoav Goldberg 和 Graham Neubig 三位研究者在本届 EMNLP 上做一个题为《Practical Neural Networks for NLP》的 tutorial 演讲，其概括解释了在不抛弃普通算法的情况下如何使用神经网络进行自然语言识别的方法。同时，三人还展示了使用 DyNet 工具包在神经网络训练中的优势。

该 tutorial 的幻灯片及相关代码地址：https://github.com/clab/dynet_tutorial_examples

以下是对该 tutorial 的幻灯片内容框架的整理：

第一部分大纲：

计算图结构
DyNet 中的神经网络
循环神经网络
Minibatching
加入新函数

第二部分大纲

DyNet 的优势――动态结构网络
其他架构不擅长的领域。

深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

神经网络与语言

语言是离散的和结构化的，可以用序列、树、图来表示
神经网络以连续的向量表示，天生缺乏结构性。所以神经网络进行自然语言识别的最大的挑战是如何在语言和神经网络不同结构间进行合理的转换。这篇讲义概括解释了在不抛弃普通算法的情况下如何使用神经网络进行自然语言识别。

　　深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

　　深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

　　深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

算法

图结构
前向传播

以拓扑次序在节点中正向遍历，计算节点中的输入值，通过输入给出预测（或者计算出「错误」提出一个「输出目标」）

反向传播

反拓扑次序在节点中逆向遍历，以找到最终目标节点并从该位置开始，计算最终目标节点的分支节点，并逐渐扩展至尾节点。

　　深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

两种软件模型

静态声明：第一步定义架构（可以是基本流控制，如循环和条件）；第二步输入大量数据进行模型训练，给出预测
动态声明：在计算的进行过程中隐性定义图谱（如使用操作符重载）

　　深度 | 自然语言处理顶级会议EMNLP 2016干货：从原理到代码全面剖析可用于NLP的神经网络（附获奖论文）

DyNet 是一种通用自动微分（autodiff）库与深度学习工具的结合，兼具 AD 库的灵活性与深度学习的简洁。DyNet 的 C++后端基于 Eigen（TensorFlow 也基于 Eigen），提供自定义内存管理，在 Python 中有轻量的 C++API。

©本文由机器之心编译， 转载请联系本公众号获得授权 。

　　 ?------------------------------------------------

加入机器之心（全职记者/实习生）：hr@almosthuman.cn

投稿或寻求报道：editor@almosthuman.cn

广告&商务合作：bd@almosthuman.cn

随意打赏

云知声4篇论文成果入选自然语言处理顶会ACL 2025，大模型研究再获突破

砍柴网 • 2月前

近日，第63届国际计算语言学年会ACL 2025（Annual Meeting of the Association for Computational Linguistics，简称ACL）论文接收结果正式公布。云知声在此次国际学术盛会中表现卓越，共有4篇论文被接收，其中包括2篇主会论文（Main Paper）和2篇F
可编程芯片首次用光训练神经网络

砍柴网 • 3月前

4 月 21 日消息，据最新一期《自然・光子学》杂志报道，美国宾夕法尼亚大学的工程师们开发了首款能够利用光进行非线性神经网络训练的可编程芯片。该芯片可以使用光来训练非线性神经网络 —— 这一突破可以显著加快 AI 训练速度，减少能耗，甚至为全光计算机铺平道路。▲ 芯片内部的图像 —— 白色虚线框是输入，黄色虚线框是输出
2024 年中国人工智能之自然语言处理（NLP）技术洞察

砍柴网 • 7月前

1、行业定义及发展历程自然语言处理（NLP）技术是人工智能的一个分支领域，专注于计算机与人类自然语言间的交互研究，旨在使计算机具备理解、生成与处理人类语言（涵盖文本与语音形式）的能力。NLP 作为一种集计算机科学、人工智能和语言学于一体的交叉技术，具有多样化、跨学科性、复杂性、交互性和不断变化性的特点。自然语言处理（N
新加坡国立大学赖载兴教授专访：用混沌边缘改善神经网络，与上帝掷骰子

雷锋网 • 1年前

2021年，诺贝尓奖委员会决定将物理奖颁发给复杂系统研究领域、以乔治·帕里西（George Parisi）为首三位科学家。当时不仅物理学界，许多计算神经科学家或理论机器学习学者表达了对帕里西的祝贺和感激，认为他的理论成果极大地推动了神经网络理论研究这一跨学科领域的蓬勃发展。在新加坡国立大学，Choy
车路云一体化建设：三旺通信TSN方案构建智能交通神经网络

砍柴网 • 1年前

前言一个多雾的早晨，高速公路上能见度极低，智能感知设备检测到这一情况后，立即通过V2I通信向所有车辆发送警报，车载系统自动调整至智能引导模式，确保安全行驶。同一时间，一辆故障车停在应急车道，通过V2I模块自动向监控中心求助，救援车辆迅速响应，并通过V2V通信向周边车辆发出预警，有效预防次生事故。与此同时，一辆超速车辆触
用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑

雷锋网 • 1年前

作者：赖文昕编辑：郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子？是英伟达Magic3D生成的蓝色箭毒蛙？还是斯坦福大学和微软Folding Diffusion生成的蛋白质结构？这些都是扩散模型的魔法展示，而近期，关于扩散模型的研究又进行了一次全新的升级。由新加坡国立大学尤洋团队、
微美全息研究基于混合循环神经网络架构的人机协作意图识别

砍柴网 • 1年前

在当今科技发展迅速的时代，人机协作已经成为一个重要的研究话题。随着人工智能技术的不断进步，人机协作的应用范围也越来越广泛，其在智能交通、智能家居和智能机器人等领域已经得到了广泛的应用。在实际应用中，人机协作的意图识别是一个关键问题。要实现高效的人机协作，机器需要准确地理解人类用户的意图，以
微美全息创新突破利用群体智能算法优化人工神经网络

砍柴网 • 1年前

人工神经网络（Artificial Neural Network，ANN）已成为机器学习领域的核心算法之一，推动了自然语言处理、计算机视觉、无人驾驶、语音识别、医疗诊断和推荐系统等多个领域的技术进步。近年来，人工神经网络在众多领域得到了广泛应用。在应用人工神经网络之前，需要确定网络结构并对其进行训练。网络结构的选择通常
华为等靠激光雷达推自动驾驶！特斯拉不屑全力抛弃：开始依赖神经网络

砍柴网 • 1年前

11月29日消息，据国内媒体报道称，当其他车企还在依赖激光雷达等类型的传感器为用户推出辅助/自动驾驶功能时，特斯拉已经开始依赖神经网络和人工智能进行所谓的完全自动驾驶。从目前的情况看，特斯拉的完全自动驾驶（FSD）V12版本放弃代码（30多万代码降至2000行），使用神经网络进行车
纽约大学团队开发用于基因组学的神经网络，并解释了它如何实现准确的预测 - IT思维

IT思维 • 1年前

公众号/ ScienceAI（ID：Philosophyai）编辑 | 萝卜皮机器学习方法，特别是在大型数据集上训练的神经网络，正在改变科学家进行科学发现和实验设计的方式。然而，当前最先进的神经网络因其不可解释性而受到限制：尽管他们具有出色的准确性，但他们无法描述他们是如何得出
使用卷积神经网络从相关 Moiré 超晶格的STM数据中学习有效的理论模型 - IT思维

IT思维 • 1年前

公众号/ ScienceAI（ID：Philosophyai）编辑 | 萝卜皮现代扫描探针技术，例如扫描隧道显微镜，可以获取编码量子物质基础物理的大量数据。斯图加特大学（Universität Stuttgart）的研究人员展示了如何使用卷
一种新型神经网络正在帮助物理学家应对数据分析的艰巨挑战 - IT思维

IT思维 • 2年前

公众号/ ScienceAI（ID：Philosophyai）编辑 | 绿萝假设你有一本一千页的书，但每一页只有一行文字。你使用扫描仪提取书中包含的信息，这个特定的扫描仪系统地扫描每一页，一次扫描一平方英寸，要花很长时间才能读完整本书，而且大部分时间会浪费在扫描空白处。这就是许多
GPT 爆发背后：自然语言处理的 20 年动荡

砍柴网 • 2年前

又一次，GPT-4 敛住所有老牌科企的光彩。在 ChatGPT 被誉为范式转变之作的第 3 个月，谷歌推出 PaLM-E 视觉语言模型 ( VLM ) 。功能上，除去让 AI 获得理解文字、图片的能力外，额外增添了输出指令生成机器人行动计划的控制回路。谷歌显然急了。在 OpenAI 和微软的左右夹击下，他直接甩出大招
出门问问3篇论文获自然语言处理和人工智能国际会议录用发表

砍柴网 • 3年前

7月15-17日，2022年第三届自然语言处理与人工智能国际会议（NLPAI 2022）于成都四川大学举办。继出门问问语音情感合成论文入选全球语音领域顶级会议 INTERSPEECH 2022后，出门问问语音团队的3篇论文再次被NLPAI录用发表。NLPAI会议旨在为世界各地的研究学者，工程师和科学家提供一个自然语言处
在商业场景下，自然语言处理如何联动决策智能共同发展？

雷锋网 • 3年前

在刘杰看来，如何将企业价值拆解为人的价值，再抽象为“沟通”技术，分为四步：理解、共情、表达、策略。落地到具体的产品中，即四种技能：更理解人、懂得共情、更人性化的表达、懂得说话策略。在前不久容联云举办的「 AI有心决策有智」的AI商业大会上，AI科技评论对话到容联云AI科学院院长刘杰
国双自然语言处理技术持续得到行业认可，第六次受邀亮相NLPCC 学术大会

砍柴网 • 3年前

10月13-17日,国内自然语言处理领域的顶级会议之一——2021年国际自然语言处理与中文计算会议(NLPCC 2021)在山东省青岛市举行。作为本次学术大会的受邀嘉宾,国双携最新的技术成果参会并展示成果,与参会的产学研各界人士进行了深度交流与探讨。CCF国际自然语言处理与中文计算会议(NLPCC)是CCF自然语言处理
达观数据携手CCF举办第五届“达观杯”自然语言处理文本分类竞赛开赛报名中！

产品壹佰 • 4年前

作为国内领先的智能文本处理企业，达观数据主办发起“达观杯”人工智能算法竞赛，每年一届，至今已成功举办四届。2021年，在CCF（中国计算机学会）自然语言处理专业委员会的特别支持下，第五届“达观杯”于7月正式拉开帷幕。本届“达观杯”为自然语言处理算法竞赛，围绕“基于大规模预训练模型的风险事件标签识别”的主题展开，积极推动
贪心科技 “自然语言处理”技术沙龙，线下活动圆满结束

砍柴网 • 4年前

6月26日，贪心科技在北京举办了以“自然语言处理”为主题的线下技术沙龙，本次分享的方向为：智能对话在直播电商中的落地与应用。活动邀请了中国科学技术大学硕士、对话系统领域专家王老师，作为主讲嘉宾，和在场人员一起交流探讨，共同分享关于“自然语言处理”这个主题下的真知灼见。王老师，中国科
产品经理如何入门自然语言处理（NLP）？

产品壹佰 • 4年前

自然语言处理，顾名思义即自然语言处理的技术，通常用缩写NLP指代。各类产品经理日常的工作中，会遇到大量自然语言处理的应用场景。以智能推荐为例，在待推荐物文本分类、主题分类等场景中都会用到。本篇以产品经理的视角，谈谈如何入门自然语言处理。统计模型很多大牛对人工智能的抨击在于，认为人工智能只是统计学，并不是
百度与鹏城实验室成立“自然语言处理联合实验室”

砍柴网 • 4年前

4月16日，百度与鹏城“自然语言处理联合实验室”签约暨揭牌仪式在鹏城实验室举行。中国工程院院士、鹏城实验室主任高文出席仪式并致辞，鹏城实验室人工智能研究中心主任李革教授和百度集团首席技术官王海峰代表双方介绍了联合实验室前期筹备情况并签署协议。随后，双方领导共同为联合实验室揭牌。联合实验室的成立表明百度与鹏城实验室将联

评论