Institute of Computing Technology, Chinese Academy IR
面向Internet的中文新词语检测 | |
孟遥1; 于浩1; 西野文人1; 亢世勇2; 邹纲3; 刘洋3; 刘群3 | |
2004 | |
发表期刊 | 中文信息学报 |
ISSN | 1003-0077 |
卷号 | 18.0期号:006页码:1 |
摘要 | 随着社会的飞速发展,新词语不断地在日常生活中涌现出来。搜集和整理这些新词语,是中文信息处理中的一个重要研究课题。本文提出了一种自动检测新词语的方法,通过大规模地分析从Internet上采集而来的网页,建立巨大的词和字串的集合,从中自动检测新词语,而后再根据构词规则对自动检测的结果进行进一步的过滤,最终抽取出采集语料中存在的新词语。根据该方法实现的系统,可以寻找不限长度和不限领域的新词语,目前正应用于《现代汉语新词语信息(电子)词典》的编纂,在实用中大大的减轻了人工查找新词语的负担。 |
关键词 | 计算机应用 中文信息处理 新词语 自动检测 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/32434 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.富士通研究开发中心有限公司 2.烟台师范学院,中文系 3.中科院计算技术研究所,数字化实验室 |
推荐引用方式 GB/T 7714 | 孟遥,于浩,西野文人,等. 面向Internet的中文新词语检测[J]. 中文信息学报,2004,18.0(006):1. |
APA | 孟遥.,于浩.,西野文人.,亢世勇.,邹纲.,...&刘群.(2004).面向Internet的中文新词语检测.中文信息学报,18.0(006),1. |
MLA | 孟遥,et al."面向Internet的中文新词语检测".中文信息学报 18.0.006(2004):1. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[孟遥]的文章 |
[于浩]的文章 |
[西野文人]的文章 |
百度学术 |
百度学术中相似的文章 |
[孟遥]的文章 |
[于浩]的文章 |
[西野文人]的文章 |
必应学术 |
必应学术中相似的文章 |
[孟遥]的文章 |
[于浩]的文章 |
[西野文人]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论