课程大纲-教务系统

课程大纲

多媒体技术

课程编码：081203M05008H 英文名称：Multimedia Technology 课时：40 学分：2.00 课程属性：专业普及课 主讲教师：曹娟等

教学目的要求

本课程为计算机专业硕士研究生的专业普及课。本课程系统地介绍多媒体的基本概念、理论基础及其发展方向，采取理论与实践相结合的教学方式，以培养研究生独立研究与开发多媒体的能力为主。要求学生：1. 掌握多媒体计算机技术的基础和基本技能。2.了解开发多媒体应用的程序设计或著作工具使用等有关技术。3.了解多媒体领域的研究热点与最新进展。

预修课程

机器学习，数据挖掘，自然语言处理

大纲内容

第一章综述 3学时
第1节多媒体技术概念与应用
第2节基本组成和主要研究内容
第3节发展历程和趋势
第二章多媒体技术基础 3学时
第1节多媒体信号获取
第2节多媒体信号数字化
第3节多媒体数据表示，常见文件格式，
第4节质量评估方法和常用可计算模型
第三章多媒体数据压缩 6学时
第1节数据压缩基本概念
第2节图像与视频数据压缩技术：预测编码、变换编码、量化、熵编码
第3节主要国际图像与视频压缩标准和技术
第4节音频数据压缩技术
第四章视觉样例检索技术（手工特征） 3学时
第1节全局手工特征提取
第2节局部手工特征提取
第3节手工特征与深度学习特征的联系
第五章视频语义识别（深度学习） 3学时
第1节深度学习概述
第2节卷积神经网络基础和代表性网络结构
第3节循环神经网络基础和网络结构改进
第六章多模态融合 3学时
第1节多媒体计算的背景和挑战
第2节决策融合方法
第3节特征融合方法
第4节代表应用分析
第七章迁移学习 3学时
第1节迁移学习基础知识
第2节基于实例、特征、模型、关系的方法与分析
第八章视觉模型可视化 3学时
第1节可视化的必要性和意义
第2节可视化特征图、卷积核、特征空间的代表性方法
第3节应用案例分析
第九章模型压缩 3学时
第1节模型压缩的研究背景
第2节网络剪枝
第3节知识蒸馏
第4节参数量化
第5节网络结构设计
第6节动态计算
第十章应用实例和研究趋势 3学时
第1节真伪新闻鉴别
第2节伪造图片检测
第十一章课程设计答辩 7学时
第1节课程设计答辩
第2节技术点评

参考书

1、多媒体技术：计算、通信及应用 Ralf Steinmetz; Klara Nahrstedt 著;潘志庚、叶绿、耿卫东、林海等译 2000 清华大学出版社

课程教师信息

曹娟，博士，中科院计算所博士生导师，中国科学院大学岗位教授。计算所跨媒体计算课题组负责人。中科院“青年创新促进会”人才计划首批成员，中科院计算所“学术百星计划”成员。2008年博士毕业于中科院计算所，主要研究方向为大规模社会多媒体内容挖掘与应用。2009年在香港城市大学VIREO视频检索研究组进行三个月的合作研究；2010年在美国哥伦比亚大学DVMM数字视频与多媒体挖掘实验室进行一年的合作研究。曾获得2008和2009TRECVID国际视频检索评测第一名和第二名， 2015MediaEval国际虚假图片检测评测第一名。在MM，SIGIR，WWW，TMM，TCSVT等顶级国际会议和期刊上发表论文50余篇。承担了科技部和基金委的多项重点项目，获得2014年度北京市科学技术奖一等奖和2012年度中国计算机学会科学技术奖，相关成果已应用在新华社互联网新闻认证系统和新华百科知识库系统中。

苏荔，博士，中国科学院大学计算机科学与技术学院，副教授，硕士生导师，中国计算机学会(CCF)多媒体专委会委员，中国图象图形学学会(CSIG)多媒体专委会委员，中国数字音视频编解码技术标准(AVS)工作组成员。主要研究方向为数字图像与视频处理、多媒体计算、模式识别等。作为项目负责人或子课题负责人承担了国家自然科学基金面上项目、应急项目、青年项目，作为研究骨干参与了国家973课题、国家自然科学基金重点项目等多项国家和省部级项目的研究。第一作者论文曾获国际光学工程学会(SPIE) VCIP会议最佳论文奖，入选微软“铸星计划”学者等。自2009年起先后主讲了我校“数字图像处理”、“模式识别”、“多媒体技术”、“图像处理与计算机视觉”等研究生专业课程。