课程大纲

课程大纲

模式串匹配与信息过滤

课程编码:0839X2M06001H 英文名称:Pattern Matching and Information Filtering 课时:20 学分:1.00 课程属性:专业研讨课 主讲教师:刘燕兵

教学目的要求
本课程是为网络空间安全、计算机等相关专业研究生开设的专业研讨课,其目的是使学生初步掌握模式串匹配与内容分析算法的基本原理和方法,并了解其在智能信息处理、信息内容安全等领域的应用。本课程将系统地介绍模式串匹配与内容分析算法的基本原理、分类方法和经典算法,以及本领域最新的研究进展和工业界发展动态,同时从应用的角度介绍相关算法的实现和优化技术。对学生的要求包括:熟练掌握相关的基本概念、原理和分类,以及经典算法的设计思路与方法,通过研讨了解该技术在智能信息处理、信息内容安全等领域的应用。培养研究生的研究性学习能力,为将来的研究与应用打好基础。

预修课程
数据结构与算法设计、编译原理、计算机体系结构

大纲内容
第一章 概述 3学时
第1节 课题内容安排
第2节 模式串匹配与信息过滤的研究意义与挑战
第3节 模式串匹配与信息过滤的基本概念与定义
第4节 模式串匹配与信息过滤的技术现状
第二章 精确多模式串匹配技术 6学时
第1节 精确多模式串匹配算法的分类与基本原理
第2节 基于前缀的串匹配算法
第3节 基于后缀的串匹配算法
第4节 基于自动机的串匹配算法
第5节 基于哈希的串匹配算法
第6节 基于位并行的串匹配算法
第三章 正则表达式匹配技术 3学时
第1节 正则表达式匹配相关定义与基本理论
第2节 正则表达式匹配的研究现状与进展
第3节 扩展串匹配技术的定义、分类及匹配方法
第四章 字符串相似性搜索与文本索引技术 3学时
第1节 字符串相似性搜索的定义与分类
第2节 数据压缩技术概述
第3节 压缩文本索引的定义与分类
第五章 网络数据包分类与计数技术 3学时
第1节 网络数据包分类的基本定义
第2节 网络数据包分类的经典算法
第3节 概率计数技术
第六章 课程总结 2学时
第1节 课题内容考核研讨
第2节 课题内容总结

参考书

课程教师信息
刘燕兵,中国科学院信息工程研究所正高级工程师、博士生导师。主要开展模式串匹配与网络流处理、图计算与图数据挖掘等方面的研究工作,在国内外重要学术会议和期刊上发表论文70余篇,出版译著1本,申请发明专利和软著30余项,指导和协助指导博士生/硕士生20余人。参与了科技部重点研发计划、国家自然科学基金、中科院先导专项等20余项课题的研发工作。研发的信息内容分析系列算法库,广泛应用于国家信息安全管理重要部门。获得中央办公厅科技进步二等奖、CNCERT中国信息安全技术公开赛第一名等荣誉。