课程大纲

课程大纲

统计与机器学习

课程编码:180087027000P1001Z 英文名称:Statistics and Machine Learning 课时:60 学分:3.00 课程属性:学科核心课 主讲教师:田英杰等

教学目的要求
本课程是是统计学专业研究生的核心课。以基本问题和经典方法为导向,主要讲授四大类机器学习问题(分类、回归、聚类、降维)的若干经典方法,包括支持向量机、决策树、随机森林、逻辑回归、线性回归、岭回归、Lasso回归、K-均值等聚类算法、线性与非线性降维方法等。同时,以案例分析为辅,讲解机器学习在实际中的具体应用。

预修课程

大纲内容
第一章 总体介绍 2学时 田英杰
第1节 基本术语
第2节 假设空间
第3节 归纳偏好
第4节 发展历程
第5节 应用现状
第二章 线性模型 4学时 田英杰
第1节 基本形式
第2节 Logistic回归
第3节 线性判别分析
第4节 多分类学习
第5节 类别不平衡问题
第三章 支持向量机 6学时 田英杰
第1节 分类问题概念
第2节 最大间隔法与支持向量
第3节 对偶问题
第4节 线性可分SVM
第5节 线性SVM
第6节 统计学习理论基础
第四章 决策树和集成学习 6学时 田英杰
第1节 决策树与ID3算法
第2节 剪枝处理与C4.5算法
第3节 Bagging与随机森林
第4节 Boosting
第5节 结合策略与多样性
第五章 贝叶斯分类器 6学时 田英杰
第1节 贝叶斯决策论
第2节 极大似然估计
第3节 朴素贝叶斯分类器
第4节 半朴素贝叶斯分类器
第5节 贝叶斯网
第6节 EM算法
第六章 回归问题与算法 6学时 田英杰
第1节 回归问题概念
第2节 一元线性回归
第3节 多元线性回归
第4节 支持向量回归机
第5节 岭回归
第6节 Lasso回归
第七章 聚类问题与算法 6学时 牛凌峰
第1节 聚类问题概念
第2节 K-均值聚类
第3节 均值漂移与密度聚类
第4节 层次聚类与支持向量机聚类
第5节 模糊聚类与高斯混合模型聚类
第6节 谱聚类与近邻传播聚类
第八章 降维与特征选择 8学时 牛凌峰
第1节 k近邻学习
第2节 低维嵌入
第3节 主成分分析
第4节 核化线性降维
第5节 流形学习
第6节 子集搜索与评价
第7节 过滤式选择
第8节 包裹式选择
第9节 嵌入式选择与L1正则化
第10节 稀疏表示与字典学习
第11节 压缩感知
第九章 神经网络 4学时 牛凌峰
第1节 神经元模型
第2节 感知机与多层网络
第3节 误差逆传播算法
第4节 全局最小与局部最小
第5节 其他常见神经网络
第6节 深度学习
第十章 机器学习其他热点问题 6学时 牛凌峰
第1节 多示例学习
第2节 多视角学习
第3节 多任务学习
第4节 迁移学习
第5节 度量学习
第6节 半监督学习
第7节 规则学习
第8节 强化学习
第十一章 案例分析 2学时 牛凌峰
第1节 人行个人信用评分
第2节 工行客户忠诚度分析
第十二章 软件和工具详细介绍 4学时 牛凌峰
第1节 分类算法步骤展示
第2节 回归算法步骤展示
第3节 聚类算法步骤展示
第4节 降维算法步骤展示

参考书
1、 机器学习@ 统计学习方法 @支持向量机理论算法与拓展 周志华@ 李航@ 邓乃扬,田英杰 2016年01月@2019年05月@2009年08月 清华大学出版社@清华大学出版社@科学出版社

课程教师信息