Institute of Computing Technology, Chinese Academy IR
| 中文网页搜索日志中的特殊命名实体挖掘 | |
| 张磊1; 王斌1; 靖红芳1; 吴丽辉2 | |
| 2011 | |
| 发表期刊 | 哈尔滨工业大学学报
![]() |
| ISSN | 0367-6234 |
| 卷号 | 43.0期号:005页码:119 |
| 摘要 | 利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求. |
| 关键词 | 特殊命名实体 数据挖掘 信息检索 网页搜索日志 |
| 语种 | 英语 |
| 文献类型 | 期刊论文 |
| 条目标识符 | http://119.78.100.204/handle/2XEOYT63/36370 |
| 专题 | 中国科学院计算技术研究所期刊论文_中文 |
| 作者单位 | 1.中国科学院计算技术研究所 2.中国科学院办公厅 |
| 第一作者单位 | 中国科学院计算技术研究所 |
| 推荐引用方式 GB/T 7714 | 张磊,王斌,靖红芳,等. 中文网页搜索日志中的特殊命名实体挖掘[J]. 哈尔滨工业大学学报,2011,43.0(005):119. |
| APA | 张磊,王斌,靖红芳,&吴丽辉.(2011).中文网页搜索日志中的特殊命名实体挖掘.哈尔滨工业大学学报,43.0(005),119. |
| MLA | 张磊,et al."中文网页搜索日志中的特殊命名实体挖掘".哈尔滨工业大学学报 43.0.005(2011):119. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [张磊]的文章 |
| [王斌]的文章 |
| [靖红芳]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [张磊]的文章 |
| [王斌]的文章 |
| [靖红芳]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [张磊]的文章 |
| [王斌]的文章 |
| [靖红芳]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论