一种基于神经转换的论辩挖掘模型
论辩挖掘目标是从论辩文本中提取出论辩结构。现在存在的方法通过枚举所有的论证组成对,低效且类间不平衡。
此外由于论证的复杂性,目前为止还没有一种通用的方法可以同时处理树结构和非树结构的论证。
本文提出了一种基于神经转换的论辩挖掘模型,通过生成一系列操作以增量的方式构建论证图,避免了低效的枚举操作。此外我们的模型还可以操作树结构和非树结构的论辩而不引进任何结构化的约束。实验证明在两个公开数据集上不同结构取得了最好的结果。
应用领域:信息检索,文章自动打分,法律决策支持。
给一段段落级别的论辩文本,一个论辩挖掘系统首先检测论元(包含论辩含义的某些片段),然后提取论元之间的论辩关系,来获得论辩图。节点和边分别是论元和论辩关系。
论辩挖掘子任务:
1.论元分割(ACS,component segmentation)
2.论元分类(ACTC component type classification)
3.论辩关系识别(ARI relation identification)
4.论辩关系分类)(ARTC relation type classification)
关于很多之前的工作假设ACS论元分割已经被完成了然后关注更多其他的子任务,这篇文章里也是一样,在此基础上执行ACTC论文分类和ARI论辩关系识别。
在这些子任务中ARI是最难的因为它需要理解复杂的论元AC之间的交互,大多数之前的工作完全美剧出可能的AC对(笛卡尔积)来决定它们之间的AR关系.
然而这些方法是低效的,并且会造成类间不平衡,因为大多数AC对是没有关系的,此外由于注释方法的不同,论证图的结构主要有两种,树结构和非树状结构.
树结构主要约束是只有一个往出的关系,对于非树结构就没有这样的要求.树结构和榧树结构论证通常是分开的,目前为止没有一种通用的方法可以在没有任何语料库特定约束的情况下同时处理两种论证。
对于上述问题,提出了一种基于神经转换的论辩挖掘模型,同时分类论元AC并且识别论元关系AR。
我们的模型预测了一系列动作,以增量的方式构造一个有向论证图,通常解析复杂度为O(n)。避免了无效的枚举,减少需要评估的潜在AC对的数量,从而缓解类间不平衡问题并实现加速。
我们的模型也不会引入具体语料结构的约束,因此可以操作树结构和非树结构的论辩,有良好的泛化能力,此外我们用预训练的BERT和LSTM来增强我们的基于转化的模型。
两种不同结构的公开数据集上的大量的不同实验展示了我们的模型超过了先前的方法,并且实现了SOTA,进一步的分析揭示了我们的模型是低解析复杂度的并且适应性强。据我们所知,我们是第一个用基于转换的方法调研论辩挖掘的。
计算论辩挖掘中,主要有两种不同方法来建模论辩结构-->树结构和非树结构,
树结构:
假设论辩图可以被看成树或者森林,这使得问题更加易于计算。
根据Van Emeren et al.(2004),和Palau and Moens(3009)的理论,他们将法律文本中的论证建模为树结构并且使用人工编制的上下文无关语法来识别这些结构。
Annotating argument components and relations in persuasive es-
says.
Parsing argumentation structures in persuasive essays
树结构的数据集Persuasive Essay(PE) 已经在AM的很多研究中使用。根据这些数据集(.End-to-end argumentation mining in student essays)(Parsing argumentation structures in persuasive essays)利用Integer Linear Programming(ILP)框架来联合预测AR和AC类型,在这个框架中定义了多个结构约束以确保树结构。
arg-microtext(MT)数据集是另一种树结构的数据集,在这篇文章中(Towards segment-based recognition of argumentation structure in short texts.)提出,在这个数据集上的研究应用了基于树结构的解码机制,比如Mininum Spanning Trees(MST) Joint pre-diction in mst-style discourse parsing for argumentation mining. 和 ILP(Comparing decoding mechanisms for parsing argumentative structures)
关于基于神经网络的方法:
(Neural end-to-end learning for computational argumentation mining.)将AM作为依赖解析和多个神经网络序列的标记问题进行了研究。
(Here’s my point: Joint pointer architecture for argument mining.2017)引入了基于基于Pointer Networks(Pointer networks. 2015)的序列-序列模型,并且使用编码器和解码器的输出来分别表示论元类别和论元关系。(An empirical study of span represen tations in argumentation structure parsing 2019)提出了一种基于跨度表示的论辩结构解析模型,该模型使用ELMo(Deep contextualized word representations)来获得论元的表示。
非树结构的论辩挖掘
上面讨论的全部都是基于树结构的,但生活总是并不那么凑的好,总有一些问题等待大家解决。
于是有很多研究致力于解决非树结构问题,基本都用数据集Consumer Debt Collection Practices (CDCP),关于这个数据集,(Argument mining with structured svms and rnns. 2017)提出了基于因子图的结构学习,这种方法也可以解决树结构的PE(Persuasive Essay)数据集。
然而因子图需要根据论辩结构的类型来具体设计。(Argumentative link prediction using residual networks and multi-objective learning. 2018)在CDCP数据集上采用残差网络来进行论辩挖掘。最近(Towards better non-tree argument mining: Proposition-level biaffifine parsing with task-specifific parameterization.)提出了一种致力于解决非树结构的模型,使用特定于任务的参数化模块对论元进行编码,使用biaffine 注意模块来捕捉论元依赖。
据我们所知,目前为止没有一种通用的方法可以在没有指定语料库设计的情况下解决树结构和非树结构的论辩。因此我们的工作中提出了这样一种基于神经转换的论辩挖掘模型,既可以识别树结构也可以识别非树结构,在没有引入任何结构假设的情况下。
模型介绍