期刊检索

  • 2024年第56卷
  • 2023年第55卷
  • 2022年第54卷
  • 2021年第53卷
  • 2020年第52卷
  • 2019年第51卷
  • 2018年第50卷
  • 2017年第49卷
  • 2016年第48卷
  • 2015年第47卷
  • 2014年第46卷
  • 2013年第45卷
  • 2012年第44卷
  • 2011年第43卷
  • 2010年第42卷
  • 第1期
  • 第2期

主管单位 中华人民共和国
工业和信息化部
主办单位 哈尔滨工业大学 主编 李隆球 国际刊号ISSN 0367-6234 国内刊号CN 23-1235/T

期刊网站二维码
微信公众号二维码
引用本文:张元竞,张伟哲.一种基于位图的多模式匹配算法[J].哈尔滨工业大学学报,2010,42(2):277.DOI:10.11918/j.issn.0367-6234.2010.02.022
ZHANG Yuan-jing,ZHANG Wei-zhe.A multiple-pattern matching algorithm based on bitmap[J].Journal of Harbin Institute of Technology,2010,42(2):277.DOI:10.11918/j.issn.0367-6234.2010.02.022
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  下载PDF阅读器  关闭
过刊浏览    高级检索
本文已被:浏览 1969次   下载 1300 本文二维码信息
码上扫一扫!
分享到: 微信 更多
一种基于位图的多模式匹配算法
张元竞, 张伟哲
哈尔滨工业大学计算机科学与技术学院
摘要:
为降低自动机类多模匹配算法的空间开销,同时仍保持较低的算法时间复杂度,提出了一种基于位图的空间优化算法.将自动机全部状态按照字典树结构的层数划分,将访问频率较低的后若干层状态对应的转移表压缩存储,并使用位图提高对被压缩信息的检索速度.经过实验和在实际应用环境中的验证,这种改进算法能够大幅降低空间开销,而匹配时间或响应时间基本不变.在模式串的数量达到万条以上规模时,实验表明优化算法能够降低25%~70%的空间消耗.
关键词:  多模匹配  AC算法  有限状态自动机  位图
DOI:10.11918/j.issn.0367-6234.2010.02.022
分类号:TP301.6
基金项目:国家自然科学基金资助项目(60703014);高等学校博士学科点专项科研基金资助项目(20070213044);中国博士后科学基金资助项目(20070410263);哈尔滨工业大学优秀青年教师培养计划资助项目(HITQNJS.2007.034)
A multiple-pattern matching algorithm based on bitmap
ZHANG Yuan-jing, ZHANG Wei-zhe
School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China
Abstract:
In order to reduce the memory consumption of automata algorithms in the field of multi-pattern matching,this paper proposes an efficient space optimization algorithm based on bitmap.It divides all the states in the automata into two groups by their depth in the data structure "trie",and reduces the memory consumption of the deeper group that will be retrieved less.It also makes use of bitmap to improve the time efficiency of the deeper group.Our experiments show that this algorithm can sharply reduce the memory consumption,and when the number of patterns is more than the level of 10 thousand,the space consumption can be decreased by 25%-70%.
Key words:  multi-pattern matching  Aho-Corasick algorithm  finite state automata  bitmap

友情链接LINKS