课程大纲

课程大纲

机器学习算法实验

课程编码:180206085410M5001Y 英文名称:Machine Learning Algorithm Experiment 课时:40 学分:1.00 课程属性:实验课 主讲教师:王泳

教学目的要求
本课程是人工智能学院工程硕士研究生培养中的一门实验课。21世纪以来,在数据和计算能力指数式增长的支持下,机器学习算法在应用中取得了重大突破,如人脸识别、语音识别、自然语言处理、网页搜索、购物推荐、自动化交易等方面都取得了突破性进展,掀起了新一轮的人工智能浪潮。这些应用的背后是一大批新的机器学习算法,如统计学习理论、支持向量机、概率图模型、深度神经网络等,这些算法都通过计算机程序实现,因此实现机器学习算法的实际应用离不开计算机操作实验的支撑。

预修课程
高等数学,矩阵论,数理统计

大纲内容
第一章 绪论 2.5学时 王泳
第1节 课程介绍
第2节 模式识别
第3节 有关模式识别的若干问题
第4节 机器学习
第5节 机器学习面对的挑战
第二章 K-近邻算法 2.0学时 王泳
第1节 K-近邻算法概述
第2节 K-近邻算法的实现:kD树
第3节 实战:利用K-近邻算法改进约会网站
第三章 朴素贝叶斯 5.0学时 王泳
第1节 贝叶斯定理
第2节 贝叶斯学习:朴素贝叶斯
第3节 贝叶斯决策
第4节 贝叶斯参数估计
第5节 实战:利用朴素贝叶斯分类模型进行文档分类
第6节 实战:利用朴素贝叶斯分类模型过滤垃圾邮件
第四章 逻辑回归与梯度下降法 4.5学时 王泳
第1节 线性回归与最小二乘法
第2节 逻辑回归
第3节 梯度下降法及其改进算法
第4节 实战:用梯度下降法拟合逻辑回归模型最佳参数
第5节 实战:用梯度下降法求Rosenbrock函数的极值
第五章 支持向量机 5.0学时 王泳
第1节 支持向量机简介
第2节 寻找最大间隔
第3节 序列最小优化
第4节 核函数及其应用
第六章 AdaBoost算法 5.0学时 王泳
第1节 集成学习算法简介
第2节 AdaBoost算法原理
第3节 单层决策树与AdaBoost算法
第4节 实战:通过AdaBoost算法进行分类
第5节 非平衡分类
第七章 K-means 算法 4.0学时 王泳
第1节 无监督学习
第2节 K-means算法
第3节 二分K-means算法
第4节 实战:K值的选择与可视化
第八章 Apriori 算法 5.0学时 王泳
第1节 关联分析
第2节 Apriori算法
第3节 实战:从超市购物清单中挖掘信息
第4节 实战:发现毒蘑菇的相似特征
第九章 主成分分析 2.0学时 王泳
第1节 数据降维
第2节 实战:对Iris数据集降维
第十章 奇异值分解 5.0学时 王泳
第1节 特征值分解
第2节 奇异值分解
第3节 实战:图片压缩
第4节 实战:基于协同过滤的推荐系统

教材信息
1、 Python人工智能开发从入门到精通 杨柳 43952 北京大学出版社

参考书
1、 Python人工智能 杨博雄 44256 清华大学出版社

课程教师信息
王泳,博士,讲师,北京人工智能学会理事,北京医学会检验医学分会检验信息与实验室自动化学组副组长。
毕业于中科院自动化研究所模式识别国家重点实验室,在大数据分析、模式识别、自然语言处理等领域进行了较为深入研究,主持、参与多项国家973、863、自然科学基金、中科院院长基金等项目研究,发表学术论文40多篇,获得国家发明专利2项、国家计算机软件著作权2项。

获得奖项:
(1) 第一届中国科学院大学领雁奖章-振翅奖, 一等奖, 研究所(学校), 2020
(2) 第九届吴文俊人工智能科技进步奖, 二等奖, 部委级, 2019
(3) 第十二届中国产学研合作创新成果奖, 二等奖, 国家级, 2018