Institute of Computing Technology, Chinese Academy IR
一种基于子串识别的多模式串匹配算法 | |
何慧敏; 刘燕兵; 谭建龙; 郭莉 | |
2011 | |
发表期刊 | 计算机应用与软件 |
ISSN | 1000-386X |
卷号 | 28.0期号:011页码:10 |
摘要 | 多模式串匹配算法是网络内容过滤系统的核心技术。巨大的存储空间开销是制约多模式匹配串算法应用的瓶颈之一。提出一种基于子串识别的多模式匹配算法——HashBOM,该算法利用位哈希表存储模式串的子串信息以大幅度减少存储空间,利用递归哈希函数计算字符串的哈希值以实现快速匹配。理论分析表明,该算法的空间复杂度为O(rm^2),优于基于子串识别的匹配算法BOM的空间复杂度0 (mr|∑|log2 m);该算法搜索匹配过程的平均时间复杂度为O(nlog|∑|mr/m),与BOM算法相同(其中m为最短模式串的长度,r为模式串的个数,n为待匹配文本的长度,|∑|为字母表的大小)。在随机数据集和真实数据集上的实验表明,该算法的存储空间远远低于BOM算法,而匹配速度与BOM算法相当,非常适合在线实时匹配的应用环境。 |
关键词 | 多模式串匹配算法 位哈希表 递归哈希函数 空间压缩 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/31170 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 何慧敏,刘燕兵,谭建龙,等. 一种基于子串识别的多模式串匹配算法[J]. 计算机应用与软件,2011,28.0(011):10. |
APA | 何慧敏,刘燕兵,谭建龙,&郭莉.(2011).一种基于子串识别的多模式串匹配算法.计算机应用与软件,28.0(011),10. |
MLA | 何慧敏,et al."一种基于子串识别的多模式串匹配算法".计算机应用与软件 28.0.011(2011):10. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[何慧敏]的文章 |
[刘燕兵]的文章 |
[谭建龙]的文章 |
百度学术 |
百度学术中相似的文章 |
[何慧敏]的文章 |
[刘燕兵]的文章 |
[谭建龙]的文章 |
必应学术 |
必应学术中相似的文章 |
[何慧敏]的文章 |
[刘燕兵]的文章 |
[谭建龙]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论