课程大纲

课程大纲

机器学习系统

课程编码:280223085405P3002 英文名称:Machine Learning Systems 课时:40 学分:2.00 课程属性:专业课 主讲教师:刘杰等

教学目的要求
本课程是软件工程学科电子信息专业学位的专业课。本课程讲解支撑机器学习算法训练、推理、优化、部署、维护的软件系统,包括这些系统的设计原理、架构及实现技术,涵盖单机版机器学习系统、分布式机器学习系统、深度学习系统等。机器学习系统是人工智能领域的核心基础软件,通过本课程学习,使学生充分理解机器学习系统的设计原理和主流实现技术,通过实践更好的利用这些系统进行机器学习应用全生命周期的开发和维护,也促进对机器学习算法的设计和优化。

预修课程
机器学习相关基础课、程序设计类课程

大纲内容
第一章 机器学习系统概述 (3学时) 3学时 刘杰
第1节  机器学习系统起源、历史及趋势(2学时)
第2节  机器学习系统总体框架(1学时)
第二章 机器学习算法训练原理(3学时) 3学时 刘杰
第1节  机器学习基础(1学时)
第2节  单机训练优化算法(2学时)
第三章 单机机器学习系统(3学时) 3学时 刘杰
第1节  Python scikit-learn(2学时)
第2节  Java Weka(1学时)
第四章 分布式机器学习算法训练原理(3学时) 3学时 刘杰
第1节  分布式训练优化算法(1学时)
第2节  数据与模型并行(1学时)
第3节  通信机制(1学时)
第五章 分布式机器学习系统(3学时) 3学时 刘杰
第1节  Spark MLlib(1学时)
第2节  Xgboost(1学时)
第3节  Ray(1学时)
第六章 深度学习系统-1(3学时) 3学时 马志柔
第1节  深度神经网络训练原理(2学时)
第2节  TensorFlow(1学时)
第七章 深度学习系统-2(3学时) 3学时 马志柔
第1节  Pytorch(1学时)
第2节 PaddlePaddle、MindSpore及其他(2学时)
第八章 自动化机器学习系统(3学时) 3学时 刘杰
第1节  自动化超参数搜索原理(1学时)
第2节  Ray Tune及其他系统(2学时)
第九章 模型推理服务系统(3学时) 3学时 马志柔
第1节  模型推理技术原理(1学时)
第2节  机器学习框架提供的推理服务(1学时)
第3节  第三方推理引擎(1学时)
第十章 生产环境机器学习生命周期管理MLops(4学时) 3学时 马志柔
第1节  MLops概念与方法 (1学时)
第2节  面向机器学习的数据工程(1学时)
第3节  模型管理(1学时)
第4节 业务集成及模型迭代(1学时)
第十一章 机器学习系统前沿技术(3学时) 3学时 刘杰
第1节  强化学习系统(1学时)
第2节  大模型系统(1学时)
第3节  其他前沿技术(1学时)
第十二章 项目实践及演示汇报-1:多系统算法对比(3学时) 3学时 刘杰
第1节  单机版、分布式、深度学习系统各选择1种安装配置,实现1-2种相同算法,进行模型、资源、性能等对比分析,编写报告
第十三章 项目实践及演示汇报-2:MLops实践(3学时) 3学时 马志柔
第1节  选择1个包含公开数据集的机器学习任务,按照MLops的全流程进行开发管理,将模型发布到指定平台,编写报告

参考书

课程教师信息
刘杰,中国科学院软件研究所研究员,国科大硕士导师。研究关注面向大数据和机器学习的系统软件。作为负责人主持国家自然科学基金项目2项、国家重点研发计划课题1项、中科院科技创新项目1项、民航总局科技重大专项1项。作为负责人开展了10余项企业合作项目,合作方包括华为、京东、中航信等企业。参与中科院A类先导专项“地球大数据科学工程”,带领团队研发EarthDataMiner,作为可持续发展大数据平台重要组成部分正式发布。获测绘科技进步特等奖1项,发表论文50余篇。

马志柔,男,硕士研究生,中国科学院软件研究所高级工程师。专注于大数据智能分析和机器学习算法研究,积累了丰富的系统研发和应用经验。参与多项国家科研及企业项目,取得显著科研成果,成功将产品广泛运用于政务、军工、教育、医疗、法律、民航等多领域。