阿里巴巴AAAI 2018录用论文：将句法信息加入实体表示模型

AAAI 2018 阿里巴巴

作者：奕欣

2018/01/06 09:26

雷锋网 AI 科技评论按：AAAI 2018 将于 2 月 2 日 - 2 月 7 日在美国新奥尔良举行，雷锋网(公众号：雷锋网) AI 科技评论也将到现场进行一线报道。

在今年的 AAAI 2018 上，阿里巴巴共有 11 篇论文被录用，并做了一系列的论文解读。本文为阿里巴巴业务平台事业部供稿，雷锋网 AI 科技评论经授权发布。

论文名称：Syntax-aware Entity Embedding for Neural Relation Extraction（句法敏感的实体表示用于神经网络关系抽取）

团队名称：业务平台事业部

作者：何正球，陈文亮，张梅山，李正华，张伟，张民

摘要

关系抽取任务大规模应用的一个主要瓶颈就是语料的获取。近年来基于神经网络的关系抽取模型把句子表示到一个低维空间。这篇论文的创新在于把句法信息加入到实体的表示模型里。首先，基于 Tree-GRU，把实体上下文的依存树放入句子级别的表示。其次，利用句子间和句子内部的注意力，来获得含有目标实体的句子集合的表示。

研究背景和动机

关系抽取任务大规模应用的一个主要瓶颈就是语料的获取。远程监督模型通过将知识库应用于非结构化文本对齐来自动构建大规模训练数据，从而减轻对人工构建数据的依赖程度，并使得模型跨领域适应能力得到增强。然而，在利用远程监督构建语料的过程中，仅仅利用实体名称进行对齐，而不同实体在不同关系下应该具有更加丰富的多样的语义表示，从而导致错误标注等问题。因此，一套更加丰富的实体表示显得尤为重要。

另一方，基于语法信息的方法通常作用于两个实体之间的关系上，而语法信息是可以更加丰富实体的表示的。因此，本文基于句法上下文的实体表示来丰富实体在不同关系模式下的语义，并结合神经网络模型处理关系抽取任务。

主要方法

阿里巴巴AAAI 2018录用论文：将句法信息加入实体表示模型

首先，基于依存句法树，利用基于树结构的循环神经网络（Tree-GRU）模型生成实体在句子级别的表示。如上图所示，有别于仅仅使用实体本身，我们能够更好地表达出长距离的信息。具体的实体语义表示如下图所示。我们使用 Tree-GRU 来获得实体的语义表示。

阿里巴巴AAAI 2018录用论文：将句法信息加入实体表示模型

其次，利用基于子节点的注意力机制（ATTCE，上图）和基于句子级别的实体表示注意力机制(ATTEE，下图)来减轻句法错误和错误标注的负面影响。

阿里巴巴AAAI 2018录用论文：将句法信息加入实体表示模型

实验结果

本文在 NYT 语料上进行了实验。最终结果如上图所示。其中，SEE-CAT 和 SEE-TRAINS 分别是本文使用的两种结合三种向量表示（句子的向量表示，两个实体的向量表示）的策略。从图中可以看出，本文提出的模型在相同数据集上取得了比现有远程监督关系抽取模型更好的性能。

总结

本文的实验结果表明，更丰富的命名实体语义表示能够有效地帮助到最终的关系抽取任务。

如果您也有论文被 AAAI 录用，欢迎关注雷锋网 AI 科技评论（aitechtalk），在后台留下联系方式，雷锋网将与您联系，并进行更多交流！

专题

AAAI 2018 查看更多文章

阿里巴巴AAAI 2018录用论文：将句法信息加入实体表示模型

摘要

研究背景和动机

相关工作介绍

主要方法

实验结果

总结