课程大纲

课程大纲

深度学习方法与应用

课程编码:180206085406P3002Y 英文名称:Methods and Applications of Deep Learning 课时:40 学分:2.00 课程属性:专业课 主讲教师:黄岩等

教学目的要求
本课程重点讲述深度学习的定义、方法与应用,要求学生掌握深度学习的基本原理。此外,通过实践环节的设计,让学生能够更好地结合实际应用,结合不同模型与方法的特点进行有效地运用,进而解决实际问题。
要求学生掌握数学和编程基础知识,其中数学基础知识包括:概率论和线性代数,编程基础包括:Python语言和Pytorch平台等。

预修课程
线性代数、概率统计、Python编程

大纲内容
第一章 课程介绍 3学时 黄岩
第1节 课程基本信息
第2节 深度学习历史
第3节 典型应用情况
第二章 深度学习早期模型 3学时 黄岩
第1节 深度前馈网络
第2节 深度自编码机
第3节 受限玻尔兹曼机
第三章 卷积神经网络 3学时 黄岩
第1节 基本运算
第2节 典型网络结构
第3节 卷积神经网络应用
第四章 循环递归神经网络 3学时 黄岩
第1节 基本网络单元
第2节 网络变体
第3节 循环神经网络应用
第五章 深度学习平台 3学时 黄岩
第1节 平台介绍
第2节 调试技巧
第3节 网络优化
第六章 深度强化学习 3学时 黄岩
第1节 背景介绍
第2节 模型无关的算法
第3节 深度强化学习应用
第七章 深度认知网络 3学时 黄怀波
第1节 注意机制建模
第2节 Transformer网络
第3节 新型网络架构
第八章 深度生成式模型 3学时 黄怀波
第1节 生成对抗网络
第2节 变分自编码器
第3节 最新生成模型
第九章 预训练模型 3学时 黄怀波
第1节 大语言模型
第2节 多模态大模型
第十章 典型应用场景:预训练模型的应用 3学时 黄怀波
第1节 自然语言应用
第2节 计算机视觉应用
第3节 多模态应用
第十一章 典型应用场景:数据内容合成与编辑 3学时 黄怀波
第1节 图像内容编辑
第2节 视频内容合成
第3节 科学数据合成
第十二章 典型应用场景:视觉-语言导航 3学时 黄岩
第1节 离散场景导航
第2节 连续场景导航
第3节 开放场景导航
第十三章 课程设计展示与点评 3学时 黄岩
第1节 课程设计展示与点评
第十四章 答疑 1学时 黄岩
第1节 课程答疑

参考书
1、 Deep Learning:Foundations and Concepts Christopher M. Bishop , Hugh Bishop 2023年11月 Springer
2、 Deep learning Ian Goodfellow, Yoshua Bengio, Aaron Courville 2016年11月 MIT Press

课程教师信息
黄岩,国家自然科学基金委优秀青年科学基金获得者,中国科学院自动化研究所副研究员。研究方向为多模态理解和视频分析,在相关领域的CCF-A类期刊和会议上发表论文共计40余篇,曾获国内外学术会议最佳论文奖3项、国内外主流竞赛冠军4项,担任CVPR领域主席、CVPR和ICCV上3次多模态主题研讨会的共同组织主席。曾获得中国图象图形学学会青年科学家奖、中国科学院院长特别奖、NVIDIA创新研究奖等。

黄怀波,中国科学院自动化研究所副研究员,中国图象图形学会视觉大数据专委会委员,北京图象图形学学会理事。2019年在中国科学院大学人工智能学院获得博士学位。主要研究方向包括计算机视觉、图像处理、深度合成与鉴别等。目前已在人工智能领域权威期刊和会议上发表40多篇文章,其中CCF-A类20篇,包括TPAMI、IJCV、NeurIPS、CVPR、ICCV 和ECCV等,出版Springer专著一部。长期担任人工智能领域权威期刊IEEE TPAMI、TIP、TNNLS、TIFS、PR以及领域顶级学术会议NeurIPS、ICML、ICLR、CVPR、ICCV等审稿人。入选北京市科协青年人才托举工程和中国科学院青年创新促进会,曾获得北京市优秀毕业生、中国科学院院长奖, ICME研讨会最佳学生论文奖等荣誉。