CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
一种改进的实体关系抽取算法——OptMultiR
延浩然; 靳小龙; 贾岩涛; 程学旗
2018
发表期刊中文信息学报
ISSN1003-0077
卷号32.0期号:009页码:66
摘要作为知识图谱构建过程中的关键步骤,关系抽取这一从海量自然语言文本中抽取实体间关系的任务近年来得到了越来越广泛的关注。如今,远程监督(distant supervision)方法通过与已有知识库(knowledge base)中的实体和关系进行对齐,可以直接使用源文本进行训练从而省去了人工标记数据的过程。其中,使用了多实例多标签(multi-instance multi-label)模型的MultiR算法取得了很好的抽取效果。但该算法存在两个问题:抽取过程中未考虑实体对之间可能已存在的关系,以及概率图匹配计算中使用的贪心算法无法获得最优解。该文针对上述问题进行了改进。首先,在关系抽取的打分过程中,考虑到同一实体对可能存在的多个关系之间具有一定关联性,该文引入了关系权重矩阵,使其在抽取过程中将实体对已知的关系转换为权重向量对打分进行干预,以此减少个别文本特征的干扰,提高抽取准确率。其次,在概率图匹配过程中,为了将图的匹配从局部最优值提升为全局最优值,该文将原有的贪心算法替换为基于状态压缩的动态规划算法。实验结果证明,优化后的MultiR模型,称之为OptMultiR,其关系抽取性能得到了显著提升。
关键词关系抽取 远程监督 多实例多标签学习
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/26239
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
延浩然,靳小龙,贾岩涛,等. 一种改进的实体关系抽取算法——OptMultiR[J]. 中文信息学报,2018,32.0(009):66.
APA 延浩然,靳小龙,贾岩涛,&程学旗.(2018).一种改进的实体关系抽取算法——OptMultiR.中文信息学报,32.0(009),66.
MLA 延浩然,et al."一种改进的实体关系抽取算法——OptMultiR".中文信息学报 32.0.009(2018):66.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[延浩然]的文章
[靳小龙]的文章
[贾岩涛]的文章
百度学术
百度学术中相似的文章
[延浩然]的文章
[靳小龙]的文章
[贾岩涛]的文章
必应学术
必应学术中相似的文章
[延浩然]的文章
[靳小龙]的文章
[贾岩涛]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。