CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
中文网页搜索日志中的特殊命名实体挖掘
张磊1; 王斌1; 靖红芳1; 吴丽辉2
2011
发表期刊哈尔滨工业大学学报
ISSN0367-6234
卷号43.0期号:005页码:119
摘要利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求.
关键词特殊命名实体 数据挖掘 信息检索 网页搜索日志
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/36370
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.中国科学院计算技术研究所
2.中国科学院办公厅
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
张磊,王斌,靖红芳,等. 中文网页搜索日志中的特殊命名实体挖掘[J]. 哈尔滨工业大学学报,2011,43.0(005):119.
APA 张磊,王斌,靖红芳,&吴丽辉.(2011).中文网页搜索日志中的特殊命名实体挖掘.哈尔滨工业大学学报,43.0(005),119.
MLA 张磊,et al."中文网页搜索日志中的特殊命名实体挖掘".哈尔滨工业大学学报 43.0.005(2011):119.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[张磊]的文章
[王斌]的文章
[靖红芳]的文章
百度学术
百度学术中相似的文章
[张磊]的文章
[王斌]的文章
[靖红芳]的文章
必应学术
必应学术中相似的文章
[张磊]的文章
[王斌]的文章
[靖红芳]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。