CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
基于内容和分层结构的XML文件自动分类方法
唐凯
2007
发表期刊计算机工程与应用
ISSN1002-8331
卷号43.0期号:003页码:168
摘要提出了一种以XML文件内在的分层结构为基础的文件分类方法,井与改良的VSM方击的实验结果进行了比较。和以往XML文件的分类方法不同的是.此方法更加注重XML文件特有的结构信息。首先利用TF-IDF方法针对XML文件非蛄构的信息产生一般特征集,然后再针对XML文件各个屡次重要性赋予一定的权重。从而产生层次特征集,然后根据一些领域知识,产生知识特征榘。将三个特征集结合起来对XML进行分类。试验结果表明,这种方法比改良的VSM方法在分类的准确性方面有大幅的提高。
关键词特征词 文件自动分类 分层结构
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/36210
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
唐凯. 基于内容和分层结构的XML文件自动分类方法[J]. 计算机工程与应用,2007,43.0(003):168.
APA 唐凯.(2007).基于内容和分层结构的XML文件自动分类方法.计算机工程与应用,43.0(003),168.
MLA 唐凯."基于内容和分层结构的XML文件自动分类方法".计算机工程与应用 43.0.003(2007):168.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[唐凯]的文章
百度学术
百度学术中相似的文章
[唐凯]的文章
必应学术
必应学术中相似的文章
[唐凯]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。