大模型技术与应用
课程编码:18087B125100M3092Z
英文名称:Large Model Technology and Applications
课时:16
学分:1.00
课程属性:专业课
主讲教师:许健
教学目的要求
帮助学生掌握大模型技术的基本原理和应用,培养学生具备独立设计、实现和评估大模型的能力,提高学生的创新能力和实践能力,能够将大模型技术应用于实际问题解决中。
预修课程
无
大纲内容
第一章 大模型技术的基本原理 2.0学时 许健
第1节 大模型技术的定义、分类、优缺点
第二章 大模型的训练和优化 3.0学时 许健
第1节 大模型的训练和优化方法,包括批量梯度下降、随机梯度下降、学习率调整
第三章 大模型的正则化 3.0学时 许健
第1节 大模型的正则化方法,包括L1正则化、L2正则化、dropout等
第四章 大模型的压缩和加速 2.0学时 许健
第1节 大模型的压缩和加速方法,包括剪枝、量化、并行化
第五章 大模型的应用 2.0学时 许健
第1节 大模型在自然语言处理、图像处理、语音识别、推荐系统等领域的应用
第六章 大模型的评估 4.0学时 许健
第1节 大模型的评估指标,包括准确率、召回率、F1分数等
参考书
1、
大数据技术原理与应用(第2版)
林子雨
2023年1月
人民邮电出版社
课程教师信息
许健,中国科学院大学经济与管理学院教授。