D=(S,T,Y)
。S
表示输入句子,T
表示输出三元组,Y
表示出现在D
中的一系列标签s∈S
,它对应于一个列表t∈T
,可以包含一个或多个输出三元组。 关系生成器(Relation Generator)
我们促使语言模型通过对目标未见过的关系标签进行调节来生成合成样本。如算法1所示,关系生成器$M_g$首先对所见数据集$D_s$的样本进行微调(第1行),然后通过关系标签$Y_u$提示来生成合成样本集$D_{synthetic}$。
输入:Relation: y
输出:Context: s. Head Entity: $e_{head}$, Tail Entity: $e_{tail}$.
我们采用因果语言模型作为我们的关系生成器,以自回归方式对结构化序列进行采样。如果出现解码错误,即在生成的上下文中找不到实体,我们会丢弃该样本并继续生成,直到达到一个固定的有效样本数量。
关系提取器(Relation Extractor)
如算法1所示,关系提取器$M_e$首先在所见数据集$D_s$的样本上进行微调(第2行),最后在合成样本$D_{synthetic}$上进行调整(第4行)。最后,$M_e$被用来预测并从测试句子$S_u$中提取关系三元组(第5和第6行)。
输入: Context: s
输出: Head Entity: $e_{head}$, Tail Entity: $e_{tail}$, Relation:y
我们使用标准的序列-序列目标进行训练,并使用贪婪解码进行生成。为了预测一个给定句子s中的单一关系三元组,我们可以在没有任何初始解码器输入的情况下生成模型输出。在实体或关系无效的情况下,我们将其视为该样本的空预测。另一方面,通过提供实体信息作为初始解码器输入,可以很容易地支持ZeroRC的预测。
输入: Context: s, Head Entity: $e_{head}$, Tail Entity: $e_{tail}$., Relation:
输出: y
使用三元组搜索解码法(Triplet Search Decoding)提取多个三元组
鉴于关系提取器将一个句子作为输入并以自回归方式生成输出序列,如图4a中的贪婪解码可以输出一个单一的序列。如图4c所示,三联体搜索解码可以输出多个序列,每个序列对应于不同的候选关系三联体。然后我们应用一个似然阈值来过滤最终的输出序列。核心概念是在生成过程中通过考虑头部实体、尾部实体和关系标签的多个候选者来列举多个输出序列。
与其他解码方法(如beam search)相比,三元组搜索解码利用了我们结构化文本模板中的特定关系三元组结构。
整体推断概率表示:
\[\begin{aligned} p\left(\text { triplet }_{i, j, k}\right)=& p\left(e_{\text {head }, i}, e_{\text {tail }, j}, y_k\right) \\ =& p\left(y_k \mid e_{h e a d, i}, e_{\text {tail }, j}\right) \\ & \cdot p\left(e_{\text {tail }, j} \mid e_{h e a d, i}\right) \\ & \cdot p\left(e_{h e a d, i}\right) \end{aligned}\]在Wiki-ZSL和FewRel数据集上表现SOTA。
主要介绍背景知识。
零样本关系抽取: 零样本关系提取以前被框定为一个填槽任务,并通过阅读理解方法解决。然而,他们的方法需要为每个关系标签手动设计模板,这不能很好地扩展到新的关系类型。另一种方法是将其表述为一个包含性的任务,这并不是限制到一个固定的关系标签空间。相反,包含方法确定任意的句子和关系标签对是否兼容。然而,它是为句子分类设计的,不能应用于ZeroRTE。
数据增强:在有监督的低资源任务中,提高模型性能的一个流行方法是数据增强。最初开发了简单的启发式方法,如标记操作,语言建模的新方法提高了增强样本的质量。尽管有一些数据增强方法可以应用于结构化任务,如命名实体识别和关系提取,但它们需要现有的训练样本,不能轻易地适应于零样本的任务。
知识检索: RelationPrompt还利用存储在语言模型中的知识来组成基于现实语境的关系样本。为了确保生成的样本在事实上是准确的,语言模型需要强大的知识检索能力。
语言模型提示: 基于提示的方法已经显示出作为自然语言处理中零样本或小样本推理的新范式的前景。另一个优点是有可能使非常大的语言模型适应新的任务,而无需相对昂贵的微调。同时进行的工作也表明,语言模型可以产生合成训练数据。然而,这种方法尚未被证明对更复杂的任务(如三元组抽取)有效。
结构化预测: RelationPrompt为关系三元组提取生成合成数据,这是一项结构化预测任务。因此,它可以广泛适用于其他结构化预测任务,如命名实体识别、事件提取或方面情感三元组提取。
思考
抽取关系方式可以借鉴。先使用已有数据训练模型,然后迁移到其他领域。