课程大纲

课程大纲

模式识别与机器学习

课程编码:085400M01010Y 英文名称:Pattern Recognition & Machine Learning 课时:40 学分:2.00 课程属性:一级学科核心课 主讲教师:王泳

教学目的要求
本课程是中国科学院大学人工智能学院专业核心课程之一,主要面向计算机应用技术专业的在职硕士研究生开放,课程着重讲述模式识别与机器学习的基本概念,基本理论和方法、关键算法原理以及典型应用情况,注重理论与实践紧密结合,通过实例讲述如何将所学知识运用到实际应用之中,同时尽量避免引用过多的、繁琐的数学推导。
课程教学目标主要包括三方面,一是掌握模式识别与机器学习的基本概念和方法;二是有效地运用所学知识和方法解决实际问题;三是为研究新的模式识别与机器学习的理论和方法打下基础。
在完成本课程后,学生应能够:掌握模式识别与机器学习的基本原理;针对实际问题设计解决方案;理解主流的模式识别与机器学习方法;熟练使用1~2种模式识别与机器学习算法工具。

预修课程
高等工程数学

大纲内容
第一章 模式识别与机器学习概述 6学时
第1节 课程介绍
第2节 模式识别基本概念
第3节 模式识别过程
第4节 模式识别系统
第5节 模式识别主要方法概述
第6节 模式识别简史与典型应用案例
第7节 有关模式识别的若干问题
第8节 机器学习基本概念
第9节 机器学习主要方法概述
第10节 机器学习简史与典型应用案例
第11节 机器学习面对的挑战
第二章 算法分析:有监督的机器学习方法 13学时
第1节 模式分类的定义和案例
第2节 决策树算法
第3节 惰性学习算法
第4节 进化计算方法
第5节 贝叶斯学习算法:贝叶斯定理
第6节 贝叶斯学习算法:贝叶斯决策
第7节 贝叶斯学习算法:贝叶斯参数估计
第8节 线性回归和逻辑回归
第9节 扩展线性模型:神经元网络学习算法
第10节 扩展线性模型:径向基函数网络学习算法
第11节 扩展线性模型:支持向量机学习算法
第12节 集成学习算法
第13节 数据挖掘十大经典算法概述
第14节 模型评估
第三章 数据预处理 7.5学时
第1节 数据类型
第2节 数据的基本统计描述
第3节 数据预处理的基本原因
第4节 数据预处理:属性选择
第5节 数据预处理:属性转换
第6节 数据预处理:数值属性离散化和离散属性数值化
第7节 数据预处理:自动数据处理
第8节 数据建模的困境
第9节 数据抽样:交叉验证
第四章 算法分析:无监督的机器学习方法 8学时
第1节 聚类分析基本概念
第2节 聚类分析中的数据类型与处理方式
第3节 聚类分析的主要方法:划分的方法
第4节 聚类分析的主要方法:层次的方法
第5节 聚类分析的主要方法:基于密度的方法
第6节 聚类分析的主要方法:基于网格的方法
第7节 聚类分析的主要方法:聚类高维数据
第8节 聚类分析的主要方法:基于约束的方法
第9节 聚类分析的主要方法:基于模型的方法
第10节 EM算法
第11节 聚类模型评估
第12节 离群点分析
第五章 算法分析:关联分析 4学时
第1节 关联分析的基本概念
第2节 Apriori算法
第3节 发现频繁项集的其他方法
第4节 关联规则的扩展
第六章 实验 1.5学时
第1节 常用数据集介绍
第2节 开源算法介绍

参考书
1、 机器学习 周志华 2016年 清华大学出版社

课程教师信息
王泳,博士,讲师,北京人工智能学会理事,北京医学会检验医学分会检验信息与实验室自动化学组副组长。
毕业于中科院自动化研究所模式识别国家重点实验室,在大数据分析、模式识别、自然语言处理等领域进行了较为深入研究,主持、参与多项国家973、863、自然科学基金、中科院院长基金等项目研究,发表学术论文30多篇,获得国家发明专利2项、国家计算机软件著作权2项。

获得奖项:
(1) 第一届中国科学院大学领雁奖章-振翅奖, 一等奖, 研究所(学校), 2020
(2) 第九届吴文俊人工智能科技进步奖, 二等奖, 部委级, 2019
(3) 第十二届中国产学研合作创新成果奖, 二等奖, 国家级, 2018