课程大纲

课程大纲

机器学习化学

课程编码:180082070304P4001H 英文名称:Machine Learning Chemistry 课时:20 学分:1.00 课程属性:研讨课 主讲教师:崔巍等

教学目的要求
本课程是化学学科各专业研究生的研讨课,同时也可以供生物、材料等其他学科专业研究生选修。本课程分为基础篇与应用篇两部分,结合课堂讲授与文献讨论,向学生介绍机器学习的基本原理及其在化学学科中的应用。通过本课程的讲授与研讨,使学生初步掌握机器学习的基本原理及其所能解决的科学问题,了解机器学习方法在化学及相关专业中的应用前沿,进而为今后的科学研究打好坚实的基础。

预修课程
计算机基础,高等数学或线性代数,普通化学或无机化学(上)

大纲内容
第一章 机器学习概论 0.5学时 崔巍
第1节 机器学习在化学学科中的应用背景
第二章 机器学习的理论基础 1.5学时 崔巍
第1节 机器学习的分类
第2节 机器学习的要素
第3节 机器学习的数学基础
第三章 监督学习 2学时 崔巍
第1节 k近邻
第2节 支持向量机
第3节 朴素贝叶斯方法
第4节 决策树和随机森林
第5节 线性回归
第四章 化学科学中的机器学习 2学时 白书明
第1节 化学科学的研究范式
第2节 化学体系的描述符
第3节 机器学习用于化学测量
第4节 机器学习用于势能面构建与动力学模拟
第五章 无监督学习 2学时 崔巍
第1节 k均值聚类
第2节 奇异值分解
第3节 主成分分析
第4节 语义分析
第六章 机器学习用于分子与材料研究 2学时 白书明
第1节 分子体系性质与性能的机器学习
第2节 材料体系的描述符与性能预测
第3节 合成与制备条件的自动优化
第4节 反应机理的机器学习与自动分类
第七章 人工神经网络 2学时 崔巍
第1节 感知机
第2节 卷积
第3节 人工神经网络的分类、结构与特点
第八章 机器学习用于化学生物学和药物研究 2学时 白书明
第1节 生物体系的力场学习与加速模拟
第2节 药物分子筛选与设计
第九章 其他方法和问题 2学时 崔巍
第1节 最优化方法
第2节 遗传算法
第3节 过拟合正则化
第十章 其他应用 4学时 白书明
第1节 化学合成路线的自动生成与设计
第2节 大模型机器学习用于化学研究

参考书
1、 统计学习方法 李航 2019年1月 清华大学出版社
2、 机器学习 周志华 2016年3月 清华大学出版社
3、 Python机器学习基础教程 [德] 安德里亚斯·穆勒 / [美] 莎拉·吉多 2018年1月 人民邮电出版社

课程教师信息
主讲教师 白书明研究员 崔巍副教授