课程大纲-教务系统

课程大纲

图像处理与计算机视觉

课程编码：081203M05002H 英文名称：Image Processing and Computer Vision 课时：40 学分：2.00 课程属性：专业普及课 主讲教师：蒋树强等

教学目的要求

本课程为计算机专业硕士研究生的专业普及课。本课程系统地介绍图像处理和计算机视觉的基本概念、理论基础及其发展方向，采取理论与实践相结合的教学方式，以培养研究生独立研究与开发的能力为主。通过本课程学习，希望学生：1. 掌握图像处理和计算机视觉领域的基础知识和关键技术。2.了解相关应用开发的程序设计语言或工具使用等有关技能。3.了解相关领域的研究热点与最新进展。

预修课程

高等数学、线性代数、概率统计

大纲内容

第一章绪论
第1节计算机视觉简介 1学时
第2节数字图像处理简介 1学时
第3节图像理解 1学时
第二章图像处理与计算机视觉基础
第1节人类视觉系统 1学时
第2节信源光学特性 1学时
第3节图像数字化表示 1学时
第三章图像增强
第1节灰度增强 2学时
第2节空域增强 1学时
第3节频域增强 2学时
第4节彩色图像增强 1学时
第四章特征检测
第1节特征点检测 1.5学时
第2节边缘检测 0.5学时
第3节直线检测 1学时
第五章图像对齐和拼接
第1节 2D运动模型 1学时
第2节 2D运动模型参数求解 1学时
第3节图像拼接 1学时
第六章相机模型和单视视觉
第1节射影几何简介 1学时
第2节针孔相机模型 1学时
第3节相机标定 1学时
第七章多视视觉
第1节立体视觉 1学时
第2节双视视觉 1学时
第3节多视视觉 1学时
第八章运动估计
第1节二维运动估计 1.5学时
第2节三维运动估计 1学时
第3节运动估计的最新进展 0.5学时
第九章目标跟踪
第1节基于特征匹配的目标跟踪 0.5学时
第2节基于贝叶斯的目标跟踪（卡尔曼滤波、粒子滤波） 0.5学时
第3节基于核方法(Mean Shift)的目标跟踪 0.5学时
第4节 Tracking Learning Detection (TLD)算法 0.5学时
第5节基于最优特征子集的跟踪 0.5学时
第6节基于深度学习的目标跟踪 0.5学时
第十章图像特征与表示
第1节全局特征（颜色特征、纹理特征、形状特征） 1.5学时
第2节局部特征（SIFT、HoG、LBP） 1学时
第3节基于深度学习的图像表示 0.5学时
第十一章计算机视觉中的机器学习
第1节聚类（K -Means、层次聚类、Mean-Shift、谱聚类） 1学时
第2节分类（KNN、SVM、基于决策树的提升算法、过拟合/欠拟合） 1.5学时
第3节机器学习在计算机视觉中的应用（图片分类） 0.5学时
第十二章基于深度学习的图像识别与理解
第1节神经网络和深度学习简介 0.5学时
第2节卷积神经网络和及其应用 2学时
第3节循环神经网络及其应用 0.5学时
第十三章期末考试
第1节期末考试 2学时

参考书

1、数字图像处理（第三版） Rafael C. Gonzalez 2017年1月电子工业出版社

课程教师信息

首席教授：
1. 蒋树强，
2006年3月在中国科学院计算技术研究所获计算机应用技术专业博士学位，现任中科院计算所研究员，博士生导师，中科院特聘研究员，中国科学院大学岗位教授，中科院智能信息处理重点实验室副主任；2014年度中组部“万人计划”青年拔尖人才、2013年度国家自然科学基金“优青”获得者；任IEEE与CCF高级会员，ACM会员，国际期刊ACM ToMM、IEEE Multimedia与Multimedia Tools and Applications的编委，ACM SIGMM中国分会副主席、CCF专委工委委员、CCF多媒体专委会常委、IEEE CASS北京分会副主席。主要研究方向是图像/视频等多媒体信息的分析、理解与检索技术和多模态智能技术，共在包括IEEE/ACM Transactions、ACM Multimedia、CVPR、ICCV在内的国内外刊物和会议上发表论文150多篇，获授权专利10余项。

主讲教师：
2. 卿来云，
2005年7月在中国科学院研究生院获计算机软件与理论专业博士学位，现任中国科学院大学计算机科学与技术学院，副教授，硕士生导师。自2005年起先后讲授了“机器学习”、“机器学习及案例分析”、“数据压缩”、“图像处理与计算机视觉”以及“模式识别与机器学习”等研究生专业课程。主要研究方向是机器学习、计算机视觉、图像/视频分析与理解，承担多个国家自然科学基金项目和国家863项目，共在包括IEEE Transactions、CVPR、ICCV在内的国内外刊物和会议上发表论文70多篇。

3. 苏荔，
2009年7月在中国科学院研究生院获计算机应用技术专业博士学位，现任中国科学院大学计算机科学与技术学院，副教授，硕士生导师，中国计算机学会(CCF)多媒体专委会委员，中国图象图形学学会(CSIG)多媒体专委会委员，中国数字音视频编解码技术标准(AVS)工作组成员。主要研究方向为数字图像与视频处理、多媒体计算、模式识别等。作为项目负责人或子课题负责人承担了国家自然科学基金面上项目、应急项目、青年项目，作为研究骨干参与了国家973课题、国家自然科学基金重点项目等多项国家和省部级项目的研究。第一作者论文曾获国际光学工程学会(SPIE) VCIP会议最佳论文奖，入选微软“铸星计划”学者等。自2009年起先后主讲了我校“数字图像处理”、“模式识别”、“多媒体技术”、“图像处理与计算机视觉”等研究生专业课程。