Institute of Computing Technology, Chinese Academy IR
中文网页搜索日志中的特殊命名实体挖掘 | |
张磊1; 王斌1; 靖红芳1; 吴丽辉2 | |
2011 | |
发表期刊 | 哈尔滨工业大学学报 |
ISSN | 0367-6234 |
卷号 | 43.0期号:005页码:119 |
摘要 | 利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求. |
关键词 | 特殊命名实体 数据挖掘 信息检索 网页搜索日志 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/36370 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院计算技术研究所 2.中国科学院办公厅 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 张磊,王斌,靖红芳,等. 中文网页搜索日志中的特殊命名实体挖掘[J]. 哈尔滨工业大学学报,2011,43.0(005):119. |
APA | 张磊,王斌,靖红芳,&吴丽辉.(2011).中文网页搜索日志中的特殊命名实体挖掘.哈尔滨工业大学学报,43.0(005),119. |
MLA | 张磊,et al."中文网页搜索日志中的特殊命名实体挖掘".哈尔滨工业大学学报 43.0.005(2011):119. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[张磊]的文章 |
[王斌]的文章 |
[靖红芳]的文章 |
百度学术 |
百度学术中相似的文章 |
[张磊]的文章 |
[王斌]的文章 |
[靖红芳]的文章 |
必应学术 |
必应学术中相似的文章 |
[张磊]的文章 |
[王斌]的文章 |
[靖红芳]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论