课程大纲

课程大纲

多媒体智能分析的研究进展及展望

课程编码:180086081200P0010H 英文名称:Research Progress and Prospects of Intelligent Multimedia Analysis 课时:20 学分:1.00 课程属性:高级强化课 主讲教师:蒋树强

教学目的要求
本课程拟从多媒体内容的智能分析与应用等方面开展介绍,分析当前学术论文和期刊上的最新代表性工作以及目前产业界的最新技术动态,拟从全局上介绍目前研究现状、典型技术、可能的应用场景及未来的趋势。希望通过此课程,能够让大家了解相关的研究进展和趋势,并对一些具体研究问题有进一步的深入认识。

预修课程

大纲内容
第一章 人工智能定义、历史、现状与进展 蒋树强
第1节 人工智能定义与历史 0.5学时
第2节 人工智能的挑战与技术前沿 0.5学时
第3节 人工智能的主要研究问题 0.5学时
第4节 人工智能中的多模态融合与服务 0.5学时
第5节 人工智能中的应用 0.5学时
第6节 人工智能技术展望 0.5学时
第二章 多媒体技术简介 蒋树强
第1节 多媒体技术定义 0.6学时
第2节 各种媒体形式介绍 0.7学时
第3节 多媒体主要研究内容介绍 0.7学时
第三章 多媒体智能检索技术 蒋树强
第1节 多媒体检索技术简介 0.8学时
第2节 基于内容的图像检索技术与MPEG-7标准 0.8学时
第3节 图像特征与图像相似度计算 0.8学时
第4节 基于局部特征的图像检索 0.8学时
第5节 基于深度学习的图像检索 0.8学时
第四章 视频智能分析技术 蒋树强
第1节 视频分析技术简介 0.7学时
第2节 视频分析关键技术 0.7学时
第3节 以体育视频为例的视频内容分析与理解 0.8学时
第4节 基于深度学习的视频识别与理解的关键技术 0.8学时
第五章 基于上下文关联的多媒体分析与理解 蒋树强
第1节 基于内容与上下文的多媒体检索 1.0学时
第2节 多模态信息检索与挖掘 1.0学时
第3节 多媒体上下文关联分析和理解 1.0学时
第4节 融合上下文信息中的视觉场景识别与理解 1.0学时
第六章 多媒体智能分析的当前动态与技术前沿 蒋树强
第1节 基于深度学习的视觉与语言关联 1.0学时
第2节 大模型技术介绍与当前进展 0.5学时
第3节 以食品计算为例介绍最新技术前沿 1.0学时
第4节 以多模态具身智能为例介绍最新技术前沿 1.0学时
第5节 技术展望与未来发展趋势分析 0.5学时

参考书

课程教师信息
蒋树强,中科院计算所研究员,博士生导师,国家杰出青年科学基金获得者,期刊《计算机研究与发展》、《JCST》、《ACM ToMM》编委,CCF多媒体专委会秘书长、中国人工智能学会智能服务专委会副主任、ACM SIGMM中国分会副主席、IEEE CASS北京分会副主席,主要研究方向是图像/视频等多媒体内容分析、多模态智能技术和食品计算,主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点等项目20余项,发表论文200余篇,获授权专利18项,技术应用到多个企事业单位中,先后获中国计算机学会科学技术奖、中国科学院青年科学家国际合作奖、CSIG自然科学二等奖、吴文俊人工智能自然科学一等奖、北京市科技进步二等奖。