Institute of Computing Technology, Chinese Academy IR
基于簇聚类和游程编码的正则表达式压缩算法 | |
杨嘉佳1; 姜腊林1; 姜磊2; 戴琼3; 谭建龙3 | |
2014 | |
发表期刊 | 计算机工程 |
ISSN | 1000-3428 |
卷号 | 40.0期号:008页码:282 |
摘要 | 基于簇聚类的确定型有穷自动机(DFA)压缩算法,即ClusterFA算法,解决了正则表达式匹配中的空间爆炸问题,但该算法的分组个数取理想值较为困难,且其类中心向量表的每一行中连续重复转移状态出现频率较高.针对该问题,提出一种改善ClusterFA算法的方案En_ClusterFA.提取类中心向量表行与行之间相同的首尾部分,并对其进行游程编码以建立索引表,对类中心向量表余下部分的转移状态进行游程编码.利用该方案对Bro,Snort 和L7-filter规则集进行测试,实验结果表明,除了L7_2和L7_6规则集的压缩率分别提高到96.1%和98.1%之外,其他规则集的压缩率都提高到99%以上.与ClusterFA算法的压缩率相比,En_ClusterFA平均提高了4%,证明En_ClusterFA能够有效地提高DFA的压缩效率. |
关键词 | 正则表达式 ClusterFA算法 确定型有穷自动机 游程编码 压缩率 吞吐率 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/37476 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.长沙理工大学 2.中国科学院计算技术研究所 3.中国科学院信息工程研究所 |
推荐引用方式 GB/T 7714 | 杨嘉佳,姜腊林,姜磊,等. 基于簇聚类和游程编码的正则表达式压缩算法[J]. 计算机工程,2014,40.0(008):282. |
APA | 杨嘉佳,姜腊林,姜磊,戴琼,&谭建龙.(2014).基于簇聚类和游程编码的正则表达式压缩算法.计算机工程,40.0(008),282. |
MLA | 杨嘉佳,et al."基于簇聚类和游程编码的正则表达式压缩算法".计算机工程 40.0.008(2014):282. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[杨嘉佳]的文章 |
[姜腊林]的文章 |
[姜磊]的文章 |
百度学术 |
百度学术中相似的文章 |
[杨嘉佳]的文章 |
[姜腊林]的文章 |
[姜磊]的文章 |
必应学术 |
必应学术中相似的文章 |
[杨嘉佳]的文章 |
[姜腊林]的文章 |
[姜磊]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论