


课程编码:081203M05009H 英文名称:Deep Learning Course Hours:40 Course Credit:2.00




第一章 引言(学时数:2)
1.1 深度学习的起源、发展和现状(含深度学习研发全球主要机构及科学家)
1.2 深度学习与机器学习、人工智能的关系
1.3 深度学习的定义、主要理论和方法概述
1.4 深度学习的主要应用概述
第二章 深度学习基础(学时数:5)
2.1 数学基础(向量、矩阵、概率及概率分布、微积分、熵等)
2.2 机器学习基础(最大似然估计、贝叶斯网络、无监督学习、有监督学习, 强化学习等)
2.3 神经网络基础(M-P模型、感知机/多层感知机、误差反向传播算法、误差函数/激活函数、随机梯度下降法、Hopfield神经网络、自编码器等)
第三章 卷积神经网络(Convolutional Neural Network,CNN)(学时数:3)
3.1 卷积神经网络基本结构
3.2 卷积神经网络的基本原理
3.3 卷积神经网络的变种
3.4 卷积神经网络的典型应用
第四章 循环神经网络(Recurrent Neural Network,RNN)(学时数:3)
4.1 循环神经网络
4.2 循环神经网络的训练方法
4.3 长短时记忆网络
4.4 双向循环神经网络
第五章 深度生成模型(学时数:3)
5.2 受限玻尔兹曼机
5.3 深度信念网
5.4 深度玻尔兹曼机
5.5 深度自编码器
5.6 深度生成模型的典型应用
第六章 其他典型深度学习方法(学时数:5)
6.1 生成对抗网络
6.2 胶囊网络
6.3 注意力网络
6.4 记忆网络
6.5 增强深度学习
6.6 深度森林
第七章 深度学习中的正则化(学时数:3)
7.1 正则化的概念
7.2 L1和L2正则化
7.3 数据增强
7.4 Bagging
7.5 Dropout和Dropconnect
7.6 提前终止
7.7 稀疏表示
第八章 深度学习工具(学时数:4)
8.1 深度学习工具概览
8.2 TensorFlow
8.3 PaddlePaddle
8.4 Keras
8.5 PyTorch
第九章 深度学习在图像识别中的典型应用(学时数:4)
9.1 图像分类
9.2 目标检测
9.3 图像分割
9.4 图像回归
第十章 深度学习在语音识别中的典型应用(学时数:3)
10.1 语音识别
10.2 声纹识别
10.3 语音合成
第十一章 深度学习在自然语言处理中的典型应用(学时数:5)
11.1 语言模型
11.2 机器翻译
11.3 自动摘要
11.4 机器阅读理解
11.5 图像描述


主讲教师:张新峰 ,男,中国科学院大学副教授,硕士导师
1. 学术简历
2003.09-2007.07, 河北工业大学, 计算机科学与技术专业,学士学位
2007.09-2014.07, 中国科学院计算技术研究所,计算机应用技术, 博士学位
2014.07-2017.10, 新加坡南洋理工大学, 研究员
2017.11-2018.10, 美国南加州大学, 博士后研究员
2018.12-2019.08, 中国香港城市大学, 研究员
2019.09- 至今, 中国科学院大学, 长聘教轨助理教授
2. 专业背景
张新峰老师长期从事视频、图像压缩、处理和质量评价的相关研究工作,主要工作包含:(1)通过统计分析,建立视频和图像的先验分布模型,提高视频和图像的时空预测性能,从而提高视频编解码效率,提出了时空联合的多假设高效视频解码技术和基于图像非局部相似性的环路滤波技术;(2)利用深度学习技术提高视频帧间预测性能,提出了基于卷积神经网络的双向B帧预测,基于帧率提升网络的虚拟参考帧技术和多类别卷积网络的环路滤波器;(3) 结合人眼视觉特性,探索符合人类视觉特性的视频质量评价准则,提出了细粒度压缩图像质量评价问题并建立了评测基准,同时提出了基于多阶段KLT变换的压缩图像评价方法,以及基于SVM的无参考的图像质量评测方法。