课程大纲

课程大纲

计算机视觉

课程编码:180086085404P3004H 英文名称:Computer Vision 课时:40 学分:2.00 课程属性:专业课 主讲教师:蒋树强等

教学目的要求
本课程为计算机应用技术专业硕士研究生的专业。计算机视觉是研究用机器视觉代替人的视觉系统,对输入图像和视频进行预处理、特征提取,并最终完成目标识别或跟踪等高级视觉任务。课程系统地介绍计算机视觉的基本概念、理论基础及其发展方向,采取理论与实践相结合的教学方式,培养研究生独立研究与开发的能力。要求学生不仅能够切实掌握本课程的基本理论和方法,并能在解决实际问题时灵活应用所学知识。

预修课程
高等数学,线性代数,概率论与数理统计

大纲内容
第一章 绪论
第1节 计算机视觉简介 1学时 蒋树强
第2节 计算机视觉应用场景 1学时 蒋树强
第3节 计算机视觉发展趋势 1学时 蒋树强
第二章 边缘检测
第1节 图像滤波 1学时 卿来云
第2节 图像去噪 0.5学时 卿来云
第3节 边缘检测 0.5学时 卿来云
第4节 直线检测 1学时 卿来云
第三章 图像分割
第1节 基于阈值的分割 0.5学时 卿来云
第2节 基于区域的分割 0.5学时 卿来云
第3节 基于边缘的分割 0.5学时 卿来云
第4节 基于聚类的分割 0.5学时 卿来云
第5节 基于深度学习的语义分割 1学时 卿来云
第四章 特征点检测
第1节 Harris角点检测 1学时 卿来云
第2节 SIFT特征检测 1学时 卿来云
第3节 ORB特征检测 1学时 卿来云
第五章 特征描述与匹配
第1节 梯度方向直方图 1学时 卿来云
第2节 二值特征描述子 1学时 卿来云
第3节 最近邻匹配 1学时 卿来云
第六章 图像对齐和拼接
第1节 2D运动模型 1学时 卿来云
第2节 2D运动参数估计 1学时 卿来云
第3节 图像拼接 1学时 卿来云
第七章 相机模型
第1节 射影几何基础 1学时 卿来云
第2节 针孔相机模型 1学时 卿来云
第3节 相机标定 1学时 卿来云
第八章 立体视觉
第1节 三角测量 0.5学时 卿来云
第2节 对极几何 1学时 卿来云
第3节 立体矫正 0.5学时 卿来云
第4节 立体匹配 0.5学时 卿来云
第5节 光束平差法 0.5学时 卿来云
第6节 基于深度学习的立体视觉 3学时 卿来云
第九章 运动估计
第1节 二维运动估计 1.5学时 蒋树强
第2节 三维运动估计 1学时 蒋树强
第3节 运动估计的最新进展 0.5学时 蒋树强
第十章 目标跟踪
第1节 基于特征匹配的目标跟踪 0.5学时 蒋树强
第2节 基于贝叶斯的目标跟踪(卡尔曼滤波、粒子滤波) 0.5学时 蒋树强
第3节 基于核方法(Mean Shift)的目标跟踪 0.5学时 蒋树强
第4节 Tracking Learning Detection (TLD)算法 0.5学时 蒋树强
第5节 基于最优特征子集的跟踪 0.5学时 蒋树强
第6节 基于深度学习的目标跟踪 0.5学时 蒋树强
第十一章 图像特征与表示
第1节 全局特征(颜色特征、纹理特征、形状特征) 1.5学时 蒋树强
第2节 局部特征(SIFT、HoG、LBP) 1学时 蒋树强
第3节 基于深度学习的图像表示 0.5学时 蒋树强
第十二章 计算机视觉中的机器学习
第1节 聚类(K -Means、层次聚类、Mean-Shift、谱聚类) 1学时 蒋树强
第2节 分类(KNN、SVM、基于决策树的提升算法、过拟合/欠拟合) 1.5学时 蒋树强
第3节 机器学习在计算机视觉中的应用(图片分类) 0.5学时 蒋树强
第十三章 基于深度学习的图像识别与理解
第1节 神经网络和深度学习简介 0.5学时 蒋树强
第2节 卷积神经网络和及其应用 1学时 蒋树强
第3节 循环神经网络及其应用 0.5学时 蒋树强
第4节 Transformer与多模态大模型技术 1学时 蒋树强
第十四章 考试
第1节 考试 2学时 卿来云

参考书
1、 计算机视觉:算法与应用 Richard Szeliski 2011年12月
2、 计算机视觉中的多视图几何 Richard Hartley, Andrew Zisserman 2020年1月
3、 视觉SLAM十四讲:从理论到实践(第2版) 高翔 张涛 等 1019年7月

课程教师信息
1. 蒋树强,中国科学院计算技术研究所,研究员,博士生导师。先后讲授“图像处理与计算机视觉”和“多媒体智能分析的研究进展和展望”课程,并连续两届担任国科大人工智能学院教学督导组成员。
2.卿来云, 中国科学院大学计算机科学与技术学院,教授,博士生导师。先后讲授“机器学习”、“机器学习及案例分析”、“数据压缩”、“图像处理与计算机视觉”以及“模式识别与机器学习”等研究生专业课程。