模式识别与机器学习技术
课程编码:180234081200P1008H
英文名称:Pattern Recognition and Machine Learning Technology
课时:40
学分:2.00
课程属性:学科核心课
主讲教师:王泳
教学目的要求
本课程着重讲述模式识别与机器学习的基本概念,基本理论和方法、关键算法原理以及典型应用情况,注重理论与实践紧密结合,通过实例讲述如何将所学知识运用到实际应用之中,同时尽量避免引用过多的、繁琐的数学推导。
课程教学目标主要包括三方面,一是掌握模式识别与机器学习的基本概念和方法;二是有效地运用所学知识和方法解决实际问题;三是为研究新的模式识别与机器学习的理论和方法打下基础。
在完成本课程后,学生应能够:掌握模式识别与机器学习的基本原理;针对实际问题设计解决方案;理解主流的模式识别与机器学习方法;熟练使用1~2种模式识别与机器学习算法工具。
预修课程
高等数学,线性代数,数理统计
大纲内容
第一章 模式识别与机器学习概述 王泳
第1节 课程介绍 0.2学时
第2节 模式识别基本概念 0.2学时
第3节 模式识别过程 0.2学时
第4节 模式识别系统 0.2学时
第5节 模式识别主要方法概述 0.2学时
第6节 模式识别简史与典型应用案例 0.2学时
第7节 有关模式识别的若干问题 0.2学时
第8节 机器学习基本概念 0.2学时
第9节 机器学习主要方法概述 0.2学时
第10节 机器学习简史与典型应用案例 0.2学时
第11节 机器学习面对的挑战 0.5学时
第二章 算法分析:有监督的机器学习方法 王泳
第1节 模式分类的定义和案例 1.0学时
第2节 决策树算法 1.0学时
第3节 惰性学习算法 1.0学时
第4节 进化计算方法 1.0学时
第5节 贝叶斯学习算法:贝叶斯定理 1.0学时
第6节 贝叶斯学习算法:贝叶斯决策 1.0学时
第7节 贝叶斯学习算法:贝叶斯参数估计 1.0学时
第8节 线性回归和逻辑回归 2.0学时
第9节 扩展线性模型:神经元网络学习算法 3.0学时
第10节 扩展线性模型:径向基函数网络学习算法 0.2学时
第11节 扩展线性模型:支持向量机学习算法 3.0学时
第12节 集成学习算法 2.0学时
第13节 数据挖掘十大经典算法概述 0.3学时
第14节 模型评估 0.5学时
第三章 数据预处理 王泳
第1节 数据类型 0.5学时
第2节 数据的基本统计描述 1.5学时
第3节 数据预处理的基本原因 0.5学时
第4节 数据预处理:属性选择 1.0学时
第5节 数据预处理:属性转换 1.0学时
第6节 数据预处理:数值属性离散化和离散属性数值化 1.0学时
第7节 数据预处理:自动数据处理 0.5学时
第8节 数据建模的困境 0.5学时
第9节 数据抽样:交叉验证 0.5学时
第四章 算法分析:无监督的机器学习方法 王泳
第1节 聚类分析基本概念 0.5学时
第2节 聚类分析中的数据类型与处理方式 1.5学时
第3节 聚类分析的主要方法:划分的方法 0.5学时
第4节 聚类分析的主要方法:层次的方法 0.5学时
第5节 聚类分析的主要方法:基于密度的方法 0.5学时
第6节 聚类分析的主要方法:基于网格的方法 0.5学时
第7节 聚类分析的主要方法:聚类高维数据 0.5学时
第8节 聚类分析的主要方法:基于约束的方法 0.5学时
第9节 聚类分析的主要方法:基于模型的方法 0.5学时
第10节 EM算法 0.5学时
第11节 聚类模型评估 0.5学时
第12节 离群点分析 0.5学时
第五章 算法分析:关联分析 王泳
第1节 关联分析的基本概念 1.0学时
第2节 Apriori算法 1.5学时
第3节 发现频繁项集的其他方法 0.5学时
第4节 关联规则的扩展 1.0学时
第六章 实验 王泳
第1节 常用数据集介绍 0.5学时
第2节 开源算法介绍 1.0学时
教材信息
1、
机器学习
周志华
2016年1月
清华大学出版社
参考书
1、
机器学习公式详解第2版
谢文睿 等
2023年5月
人民邮电出版社
课程教师信息
王泳,博士,讲师,中国科学院大学人工智能学院
北京人工智能学会理事
博士毕业于中科院自动化研究所模式识别国家重点实验室,在大数据分析、模式识别、机器学习等领域进行了较为深入研究,主持、参与十多项国家973、863、国家自然科学基金、中科院院长基金等项目研究,发表学术论文40多篇,国家发明专利2项,国家计算机软件著作权2项。
曾获得吴文俊人工智能科技进步二等奖,中国产学研合作创新成果二等奖,中国科学院大学领雁奖章-振翅奖