Institute of Computing Technology, Chinese Academy IR
面向中文的修辞结构关系分类体系及无歧义标注方法 | |
侯圣峦1; 费超群1; 张书涵1 | |
2019 | |
发表期刊 | 中文信息学报
![]() |
ISSN | 1003-0077 |
卷号 | 000期号:007页码:20 |
摘要 | 修辞结构理论是一种重要的篇章结构理论,其核心是修辞结构关系。该文基于修辞结构理论,结合中文文本特点,提出面向中文的层次化修辞结构关系分类体系及多元定义。同时,针对标注者遇到的歧义问题,提出了无歧义标注方法。为了便于标注,设计并实现了基于Java图形界面的标注工具RSTTagger,该工具以句子的主谓结构关键词构成的元组作为基本标注单位,自底向上逐级标注,最终标注成一棵完整的修辞结构关系树。为验证标注结果的一致性,选取160篇中文外贸领域语料进行标注,不同标注者同时标注其中50篇,标注一致性达到76.63%。该标注框架可以应用到其他领域语料标注中,已标注的160篇语料可以作为篇章结构理论研究的基础语料库。 |
关键词 | 自然语言处理 修辞结构理论 修辞结构关系 篇章结构分析 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/26915 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院计算技术研究所 2.中国科学院大学 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 侯圣峦,费超群,张书涵. 面向中文的修辞结构关系分类体系及无歧义标注方法[J]. 中文信息学报,2019,000(007):20. |
APA | 侯圣峦,费超群,&张书涵.(2019).面向中文的修辞结构关系分类体系及无歧义标注方法.中文信息学报,000(007),20. |
MLA | 侯圣峦,et al."面向中文的修辞结构关系分类体系及无歧义标注方法".中文信息学报 000.007(2019):20. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[侯圣峦]的文章 |
[费超群]的文章 |
[张书涵]的文章 |
百度学术 |
百度学术中相似的文章 |
[侯圣峦]的文章 |
[费超群]的文章 |
[张书涵]的文章 |
必应学术 |
必应学术中相似的文章 |
[侯圣峦]的文章 |
[费超群]的文章 |
[张书涵]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论