视觉信息学习与分析
课程编码:180086081203P4003H-2
英文名称:Visual Information Learning and Analysis Seminar
课时:20
学分:1.00
课程属性:研讨课
主讲教师:黄庆明等
教学目的要求
本课程是计算机应用技术专业研究生开设的专业研讨课,也可供电子科学与技术等相关专业的研究生选择,其目的是使学生初步掌握模式识别与机器学习的基本内容和算法原理,并了解其在图像与视频等分析中的最新进展和应用。本课程聚焦模式识别与机器学习的热点方向和主题,对学生的要求包括:熟练掌握模式识别和机器学习的基本方法和常用模型,通过实践和研讨使得学生对该学科前沿相关研究有比较深入的理解,培养研究生利用相关方法解决实际问题的能力,为下一步课题研究阶段运用模式识别和机器学习方法完成论文工作并进行相关的科研工作打下良好的基础。
预修课程
模式识别与机器学习,图像处理,视频分析,多媒体技术
大纲内容
第一章 课程概述
第1节 视觉信息分析课程简介 1学时 黄庆明
第2节 课程相关任务与对应技术详述 1学时 黄庆明
第二章 文本检测技术
第1节 多语言视频文本检测 1学时 黄庆明
第2节 基于深度学习的任意形状文本检测 1学时 黄庆明
第三章 目标追踪技术
第1节 面向视觉跟踪的卷积残差学习 1学时 黄庆明
第2节 基于时空嵌入的多人跟踪技术 1学时 黄庆明
第四章 人脸识别技术
第1节 一种普适的人脸识别算法 1学时 黄庆明
第2节 基于层次化注意力的人脸检测 1学时 黄庆明
第五章 跨模态检索技术
第1节 基于卷积网络的跨模态检索 1学时 黄庆明
第2节 多路对抗的无监督跨模态检索方法 1学时 黄庆明
第六章 图像标注技术
第1节 语义正则的递归图像标注 1学时 黄庆明
第2节 基于图的多标签学习 1学时 黄庆明
第七章 视觉显著检测技术
第1节 基于多尺度深度特征的视觉显著性检测 1学时 黄庆明
第2节 视觉显著预测技术综述 1学时 黄庆明
第八章 场景识别技术
第1节 基于语义向量的场景分类 1学时 黄庆明
第2节 点云环境下的场景识别 1学时 黄庆明
第九章 图像生成技术
第1节 深度卷积的对抗生成技术 1学时 李亮
第2节 可控的图像风格转换算法 1学时 李亮
第十章 图像概述生成技术
第1节 基于文本条件的图像概述生成 1学时 黄庆明
第2节 深度视觉内容解析技术 1学时 黄庆明
参考书
1、
机器学习
周志华
2016年1月
清华大学出版社
课程教师信息
1. 黄庆明,中国科学院大学计算机科学与技术学院副院长、网络空间安全学院副院长(兼),教授(二级)、博士生导师。国家杰出青年科学基金获得者,百千万人才工程国家级人选并被授予“有突出贡献中青年专家”荣誉称号,享受国务院政府特殊津贴。现为IEEE Fellow,IEEE CASS北京分会主席,CCF理事,CCF会士,CCF多媒体技术专业委员会主任,中国图象图形学学会常务理事,北京图象图形学学会副理事长。 主要研究方向为模式识别、多媒体计算、图像与视频分析、计算机视觉、机器学习等,主持承担了国家科技创新2030-”新一代人工智能“重大项目、国家自然科学基金重点项目和重点国际合作项目、863课题、973课题等国家和省部级项目的研究工作,在国内外权威期刊和重要国际会议上发表学术论文600余篇,申请国内外发明专利50余项,相关研究成果多次获得省部级奖励。自2004年起先后讲授了“模式识别”、“模式识别在图像与视频分析中的应用”、“模式识别与机器学习”、“视觉信息学习与分析”等课程。2. 李亮,中国科学院计算技术研究所副研究员、硕士生导师。国家自然科学基金委优秀青年基金获得者,研究方向为视觉计算、机器学习,在 IEEE TPAMI等汇刊和CCF-A类会议论文上发表高水平论文60余篇,ESI高被引论文6篇,申请发明专利20余项;国际期刊Electronics和JCST编委,10+次担任ACM/IEEE国际会议的组织主席,获2020年度吴文俊人工智能自然科学一等奖等。