#导入MD文档图片#论文阅读之关系抽取模型Casrel

前言

  • 文章来源:LawsonAbs(51CTO)
  • 望各位读者审慎阅读

1. 历史问题

  • 无法解决复杂的三元组抽取,比如 SEOEPO 问题
  • 将标签看做是一个离散的点,这样不利于模型学习。【具体针对这一点的优劣势分析,后面再详述】

2. 想法

全文的思想精神就是:

The basic idea is to extract triples in two cascade steps.

采用的方法是pipeline,先抽取subject,然后再抽取与这个relation-specific 相关的object

we model the relations as functions that map subjects to object, which makes it crucially different from previous works.
这句话读着十分生硬,也不懂是什么意思。感觉有点儿故弄玄虚

3. 贡献

  • directly model the triples and design a traning objective right at the triple level.
    之所以说是at the triple level,是因为之前的模型都是将二者但需训练。

$$
\begin{gather}
& \prod{j=1}^{|D|} [\prod{(s,r,o)\in T_j} p((s,r,o)|xj)] \
& = \prod
{j=1}^{|D|} [\prod_{(s,\in T_j} p(s|xj) \prod{(r,o)\in T_j | s} p((r,o)|s,xj)] \
& = \prod
{j=1}^{|D|} [\prod_{(s,\in T_j} p(s|xj) \prod{r\in T_j | s} p(o|s,xj) \prod{(r \in R \backslash T_j|s)} p((r,o)|s,x_j)] \
\end{gather}
$$
上面这个公式无非就是一个条件概率公式。

公式(3)便是这个模型标注想法的来源:

  • 首先学习一个 subject tagger $p(s|x_j)$ 用于识别句中的 subject
  • 对于每个关系r,然后学习一个object tagger $p_r{o|s,x_j}$,对于一个指定的subjet,去识别与关系相关的objects

以这种方式,我们就可以将每种relation 建模成一个函数,这个函数可以将subjects 映射成 objects,这种方式正和将(subject,object)对分类的方法相反。

所以我们就得到了模型的两个步骤:

  • step 1: first run the subject tagger to find all possible subjects in the sentence

  • step 2:for each subject found, apply relation-specific object taggers to find all relevant relations and the corresponding objects.

4. 模型

先上模型结构图,如下:
#导入MD文档图片#论文阅读之关系抽取模型Casrel

其中subject tagger 的损失函数是一个极大似然估计。

在解析subject的时候,采取的方法是最近的start-end匹配。

5. 问题

5.1 解释一下为啥 casrel 能够在一次抽取中获取到多个三元组?

其实这个与其自身结构有关,因为模型在抽取subject之后,会一次性抽取和某个relation相关的objects,而objects 可不止一个,所以会形成多个三元组。以Figure 2的那张图为例:
#导入MD文档图片#论文阅读之关系抽取模型Casrel
这张图就同时解析出(Jackie R. Brown, Birth_place, Washington)(Jackie R. Brown, Birth_place, United States of America)

上一篇:FastDFS 上的部分图片无法查看


下一篇:41.el和template区别 & VUE实现分离写法