基于深度学习的事件因果关系抽取综述

公众号关注 “ML_NLP”

设为 “星标”，重磅干货，第一时间送达！

转载自 | 专知

因果关系抽取是自然语言处理（NLP）中的一种关系抽取任务，它通过构造事件图来挖掘文本中具有因果关系的事件对，已经在金融、安全、生物等领域的应用中发挥重要作用。首先，介绍了事件抽取和因果关系等概念，并介绍了因果关系抽取主流方法的演变和常用数据集；然后，列举了当前主流的因果关系抽取模型，并且在分别对基于流水线的模型和联合抽取模型进行详细分析的基础上，对比了各种方法和模型的优缺点；此外，对各模型的实验性能及相关实验数据进行了归纳分析；最后，给出了当前的因果关系抽取的研究难点和未来的重点研究方向。

http://www.joca.cn/CN/abstract/abstract24491.shtml

人们的社会活动以事件为驱动，事件是社会活动的载体。在自然语言处理中，事件作为一种信息表示形式显得十分重要，受到越来越多的重视。事件中包含了大量的内部组成结构（如参与者、时间、地点等）和外部关联（如因果、共指、时序等语义关系）。对包含大量事件的文本进行因果关系的抽取可以实现对文本的更加深层次的理解。在航空安全［1］、医学［2］等众多领域中，因果关系抽取也发挥着重要的作用。图灵奖获得者 Bengio 表示将因果关系集成到人工智能（Artificial Intelligence，AI）中是一件大事，了解因果关系可以使得现有的人工智能更加智能高效。Pearl等［3］讲到如果没有因果推理的能力，人工智能将从根本上受到限制。

因果关系一般可以组织为事理图谱。事理图谱是表示事件之间的顺承、因果关系的有向图［4］。图中每个节点表示事件，而边用来表示事件之间的因果关系。事理图谱找出了事件的演化逻辑，从而形成大型的常识事理知识库用来直接刻画人类行为活动。很多的学者在因果关系抽取上得到了理想的结果［5-7］。

深度学习是机器学习领域如今最热门的研究方向之一，它能够模仿人类大脑的活动，使得模式识别很难解决的问题得到了合理的解决，使得自然语言处理（Natural Language Processing，NLP）相关技术取得了很大进步。近年来基于深度神经网络的因果关系抽取方法比较多，主要分为两大类：一类是基于流水线方式；另一类是基于联合抽取的方式。前者将抽取任务看作是实体识别和关系分类两个子任务，后者则是利用联合模型将因果关系三元组直接抽取出来。两者各有利弊，但是目前还缺乏对整个领域开展深入的梳理和总结。本文对现有的基于深度学习的因果关系抽取方法进行了总结：首先，分别对因果关系抽取的基本概念和方法演变进行了简要介绍，并对常用数据集进行了介绍；接着，对现有的基于深度学习的两种主要框架分别进行了详细介绍；最后，提出了未来的研究方向。

推荐阅读：

因果推断综述及基础方法介绍（一）

因果推断综述及基础方法介绍（二）

多标签文本分类研究进展

点击下方卡片，关注公众号“机器学习算法与自然语言处理”，获取更多信息：