CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
面向Internet的中文新词语检测
孟遥1; 于浩1; 西野文人1; 亢世勇2; 邹纲3; 刘洋3; 刘群3
2004
发表期刊中文信息学报
ISSN1003-0077
卷号18.0期号:006页码:1
摘要随着社会的飞速发展,新词语不断地在日常生活中涌现出来。搜集和整理这些新词语,是中文信息处理中的一个重要研究课题。本文提出了一种自动检测新词语的方法,通过大规模地分析从Internet上采集而来的网页,建立巨大的词和字串的集合,从中自动检测新词语,而后再根据构词规则对自动检测的结果进行进一步的过滤,最终抽取出采集语料中存在的新词语。根据该方法实现的系统,可以寻找不限长度和不限领域的新词语,目前正应用于《现代汉语新词语信息(电子)词典》的编纂,在实用中大大的减轻了人工查找新词语的负担。
关键词计算机应用 中文信息处理 新词语 自动检测
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/32434
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.富士通研究开发中心有限公司
2.烟台师范学院,中文系
3.中科院计算技术研究所,数字化实验室
推荐引用方式
GB/T 7714
孟遥,于浩,西野文人,等. 面向Internet的中文新词语检测[J]. 中文信息学报,2004,18.0(006):1.
APA 孟遥.,于浩.,西野文人.,亢世勇.,邹纲.,...&刘群.(2004).面向Internet的中文新词语检测.中文信息学报,18.0(006),1.
MLA 孟遥,et al."面向Internet的中文新词语检测".中文信息学报 18.0.006(2004):1.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[孟遥]的文章
[于浩]的文章
[西野文人]的文章
百度学术
百度学术中相似的文章
[孟遥]的文章
[于浩]的文章
[西野文人]的文章
必应学术
必应学术中相似的文章
[孟遥]的文章
[于浩]的文章
[西野文人]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。