模式识别与机器学习
课程编码:085400M01010Y
英文名称:Pattern Recognition & Machine Learning
课时:40
学分:2.00
课程属性:一级学科核心课
主讲教师:王泳
教学目的要求
本课程是中国科学院大学人工智能学院专业核心课程之一,主要面向计算机应用技术专业的在职硕士研究生开放,课程着重讲述模式识别与机器学习的基本概念,基本理论和方法、关键算法原理以及典型应用情况,注重理论与实践紧密结合,通过实例讲述如何将所学知识运用到实际应用之中,同时尽量避免引用过多的、繁琐的数学推导。
课程教学目标主要包括三方面,一是掌握模式识别与机器学习的基本概念和方法;二是有效地运用所学知识和方法解决实际问题;三是为研究新的模式识别与机器学习的理论和方法打下基础。
在完成本课程后,学生应能够:掌握模式识别与机器学习的基本原理;针对实际问题设计解决方案;理解主流的模式识别与机器学习方法;熟练使用1~2种模式识别与机器学习算法工具。
预修课程
高等工程数学
大纲内容
第一章 模式识别与机器学习概述 6学时 王泳
第1节 课程介绍
第2节 模式识别基本概念
第3节 模式识别过程
第4节 模式识别系统
第5节 模式识别主要方法概述
第6节 模式识别简史与典型应用案例
第7节 有关模式识别的若干问题
第8节 机器学习基本概念
第9节 机器学习主要方法概述
第10节 机器学习简史与典型应用案例
第11节 机器学习面对的挑战
第二章 算法分析:有监督的机器学习方法 13学时 王泳
第1节 模式分类的定义和案例
第2节 决策树算法
第3节 惰性学习算法
第4节 进化计算方法
第5节 贝叶斯学习算法:贝叶斯定理
第6节 贝叶斯学习算法:贝叶斯决策
第7节 贝叶斯学习算法:贝叶斯参数估计
第8节 线性回归和逻辑回归
第9节 扩展线性模型:神经元网络学习算法
第10节 扩展线性模型:径向基函数网络学习算法
第11节 扩展线性模型:支持向量机学习算法
第12节 集成学习算法
第13节 数据挖掘十大经典算法概述
第14节 模型评估
第三章 数据预处理 7.5学时 王泳
第1节 数据类型
第2节 数据的基本统计描述
第3节 数据预处理的基本原因
第4节 数据预处理:属性选择
第5节 数据预处理:属性转换
第6节 数据预处理:数值属性离散化和离散属性数值化
第7节 数据预处理:自动数据处理
第8节 数据建模的困境
第9节 数据抽样:交叉验证
第四章 算法分析:无监督的机器学习方法 8学时 王泳
第1节 聚类分析基本概念
第2节 聚类分析中的数据类型与处理方式
第3节 聚类分析的主要方法:划分的方法
第4节 聚类分析的主要方法:层次的方法
第5节 聚类分析的主要方法:基于密度的方法
第6节 聚类分析的主要方法:基于网格的方法
第7节 聚类分析的主要方法:聚类高维数据
第8节 聚类分析的主要方法:基于约束的方法
第9节 聚类分析的主要方法:基于模型的方法
第10节 EM算法
第11节 聚类模型评估
第12节 离群点分析
第五章 算法分析:关联分析 4学时 王泳
第1节 关联分析的基本概念
第2节 Apriori算法
第3节 发现频繁项集的其他方法
第4节 关联规则的扩展
第六章 实验 1.5学时 王泳
第1节 常用数据集介绍
第2节 开源算法介绍
参考书
课程教师信息
王泳,博士,讲师,北京人工智能学会理事,北京医学会检验医学分会检验信息与实验室自动化学组副组长。
毕业于中科院自动化研究所模式识别国家重点实验室,在大数据分析、模式识别、自然语言处理等领域进行了较为深入研究,主持、参与多项国家973、863、自然科学基金、中科院院长基金等项目研究,发表学术论文30多篇,获得国家发明专利2项、国家计算机软件著作权2项。
获得奖项:
(1) 第一届中国科学院大学领雁奖章-振翅奖, 一等奖, 研究所(学校), 2020
(2) 第九届吴文俊人工智能科技进步奖, 二等奖, 部委级, 2019
(3) 第十二届中国产学研合作创新成果奖, 二等奖, 国家级, 2018