睿企科技合作参与研究论文被顶级会议ICASSP 2021录用

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

引言:ICASSP 全称 International Conference on Acoustics, Speech and Signal Processing(国际声学、语音与信号处理会议),是由 IEEE 主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级学术年会

睿企 科技 ICASSP 2021获录用的论文

近日,由ICASSP2021组委会正式通知,北京睿企信息科技有限公司(以下简称:睿企科技)副总裁王全修作为主要作者,与北京大学软件工程国家工程研究中心合作的论文《IMPROVING EVENT DETECTION BY EXPLOITING LABEL HIERARCHY》成功被ICASSP 2021录用,论文概述如下:

Improving Event Detection By Exploiting label hierarchy

Xiangyu Xi1,2, Wei Ye1,†, Tong Zhang1, Quanxiu Wang3, Shikun Zhang1,†, Huixing Jiang2, Wei Wu2

1 National Engineering Research Center for Software Engineering, Peking University, Beijing, China 2 Meituan Group, Beijing, China

3 RICH AI, Beijing, China

事件检测

事件检测已经作为人工智能领域的一项基础核心技术,被广泛应用到事件图谱的构建以及文本摘要的生成。事件检测中优质的结构化知识信息,能够指导我们的智能模型具备更深层的事物理解、更精准的任务查询以及一定程度上的逻辑推理能力,从而对海量的信息分析起到至关重要的作用。

事件作为信息的一种表现形式,其定义为特定的人及物在特定的时间特定的地点相互作用的事实。事件的组成元素包含触发词、事件类型、论元以及论元角色:

触发词:事件发生的核心词,多为动词和名词。

事件类型:ACE2005 定义了8种事件类型和33种子类型。其中,大多数事件抽取均采用33 种事件类型。

论元:事件的参与者。

论元角色:事件论元在事件中充当的角色。共有35类角色,例如,攻击者 、受害者等。例

睿企科技合作参与研究论文被顶级会议ICASSP 2021录用

如:在Baghdad,当一个美国坦克对着 Palestine 酒店开火时一个摄影师死去了。该事件信息如下表所示:

事件检测任务,需要从文本中检测:事件触发词 (trigger) 和论元 (argument) 。「事件触发词」是一个事件指称中最能代表事件发生的词,是决定事件类别的重要特征,一般指动词或名词。「论元」是事件中的参与者,是组成事件的核心部分,它与事件触发词构成了事件的整个框架。识别出事件触发词 (trigger) 和论元 (argument) 后再对这两个元素进行下一步分类处理,由事件触发词分类得到事件类型,由论元分类得到论元角色。利用事件检测技术,用户可以:

免于被大量的无序非结构化文本所湮没;

让用户能够更快捷地了解到短期内发生的重大事件;

判断与历史事件是否存在内容上的关联;

检测每一件事件是否涉及新事件,实时地在某事件发生时识别出该事件。

然而,由于用户手头的文本往往在很短的时间间隔内呈现井喷式的增长,这使得准确、高效的事件检测研究非常具有挑战性。

在事件检测任务中,主流方法一般将候选触发词(trigger word)直接分类为细粒度事件,会忽略触发词中的层次结构。为了提高对细粒度事件类型的检测能力,在ICASSP2021会议中,睿企科技与美团和北大合作,提出了一种挖掘事件类型的层次结构中有价值的语义信息的细粒度事件检测方法。

该方法认为事件类型层次中有丰富且有价值的语义相关性,提出了结合事件的层次信息提供辅助的监督信息的方法,来改进细粒度事件检测。值得注意的是,该方法是第一个利用事件类型的层次结构来改进细粒度事件检测的。

根据文章中的描述,该方法把事件可以划分为两种不同粒度的层级,从粗粒度(父类)的层级中挖掘与细粒度(子类)层级事件之间的丰富的语义相关性,可以让细粒度事件的识别更加准确,即达到提高对细粒度事件类型的检测能力的目的。并通过一种新的 Logits Mapping (LM) 策略,利用标签层次中的补充监督信息,通过对细粒度类型的 Logits 的启发式映射,来生成粗粒度类型的 Logits (输入到分类器的中间表示)。这样,补充的监督信息可以帮助编码器通过反向传播产生更精确的 Logits ,从而提供了一种简单而且不需要额外的参数,并且有效的方法来改善目标任务。

目前睿企科技已在政务、警务等实际业务场景中落地该论文提及的先进技术。同时,睿企NLP能力开放平台也将向广大开发者陆续开放自主研发的NLP算法服务能力。

睿企NLP能力开放平台

睿企科技是一家专注于自然语言处理与决策引擎的认知智能高科技公司,自成立以来,致力于对大规模文本数据进行分析与价值挖掘,通过技术与业务的深度融合,为政府提供决策支持,为企业提供商机信息。睿企NLP能力开放平台,提供了70+种细分的场景化能力,包括实体抽取理解、关系挖掘、关键词提取、文本分类、文字识别等,其中仅实体抽取理解就包括证号类实体、人物类实体、地点类实体等11个大类48个服务能力,这些能力可以直接在产品和应用中调用使用。

为使开发者快速上手体验,睿企NLP能力开放平台开放的所有能力均可免费试用,以普惠、开放、易用及一站式等特性为客户提供服务。开发者可灵活高效地调用NLP服务,并快速集成到产品中,落地政务、警务、 金融 、医疗、 商业 、教育等垂直领域。

随意打赏

提交建议
微信扫一扫,分享给好友吧。