计算博弈原理与应用
课程编码:1802060811J2P2001H
英文名称:Computational Game Theory and Applications
课时:40
学分:2.00
课程属性:专业核心课
主讲教师:兴军亮等
教学目的要求
通过本课程学习,希望学生能够对于面向人工智能专业的博弈课程的整体研究框架和主要研究内容有较为全面的了解,理解博弈的基本概念和原理,掌握博弈计算的算法机制和实现方法,并且熟悉计算博弈在实际复杂问题建模和求解中的应用过程和典型案例,为后续从事相关方向的研究奠定一定的基础。
预修课程
博弈论基础、计算机算法与数据结构、机器学习
大纲内容
第一章 智能博弈课程基础 3学时 兴军亮
第1节 课程相关的基本信息
第2节 博弈论发展历史
第3节 智能博弈基础知识
第4节 博弈论应用案例
第二章 完全信息静态博弈 3学时 兴军亮
第1节 基本概念和表示
第2节 均衡分析和求解
第3节 均衡存在性讨论
第4节 其他相关的问题
第三章 完全信息动态博弈 3学时 兴军亮
第1节 定义及其扩展式表示
第2节 扩展式博弈均衡分析
第3节 子博弈精炼纳什均衡
第4节 重复博弈的均衡问题
第四章 不完全信息静态博弈 3学时 李凯
第1节 博弈类型介绍和表示
第2节 博弈均衡分析和求解
第3节 贝叶斯博弈应用示例
第4节 混合策略均衡的解释
第五章 不完全信息动态博弈 3学时 李凯
第1节 精炼贝叶斯纳什均衡
第2节 信号传递博弈及示例
第3节 其他相关的均衡概念
第4节 不完全信息重复博弈
第六章 算法化机制设计专题 3学时 李凯
第1节 算法博弈论概述
第2节 算法化机制设计产生和发展
第3节 案例研究
第4节 麦尔森定理
第七章 均衡的低效率性专题 3学时 李凯
第1节 自私路由的低效率性
第2节 自私路由的改进措施
第3节 原子自私路由的低效率性
第4节 不同类型的均衡解概念
第八章 均衡计算复杂度专题 3学时 李凯
第1节 纯纳什均衡求解算法
第2节 粗相关均衡求解算法
第3节 相关均衡求解算法
第4节 均衡计算复杂度分析
第九章 单机小游戏AI设计 3学时 兴军亮
第1节 单机小游戏环境介绍
第2节 DQN算法介绍
第3节 后续改进算法介绍
第4节 通用探索学习框架
第十章 围棋博弈AI设计 3学时 兴军亮
第1节 基础知识介绍
第2节 AlphaGo介绍
第3节 AlphaGo Zero介绍
第4节 AlphaZero介绍
第十一章 德扑博弈AI设计 3学时 李凯
第1节 德州扑克基础知识
第2节 DeepStack德州扑克AI程序
第3节 Libratus德州扑克AI程序
第4节 德州扑克AI总结
第十二章 实时策略游戏AI设计 2学时 李凯
第1节 多智能体博弈学习基础知识
第2节 星际争霸AI程序AlphaStar
第3节 刀塔AI程序OpenAI Five
第4节 王者荣耀AI程序绝悟
第十三章 课程总结及课程设计汇报 3学时 兴军亮
第1节 已学内容回顾
第2节 重点复习内容
第3节 课程总体总结
第4节 课程设计报告
第十四章 闭卷考试 2学时 李凯
第1节 上半场
第2节 下半场
参考书
1、
机器学习
周志华
2016年2月
清华大学出版社
课程教师信息
兴军亮,清华大学计算机系研究员,国家优青。2007年和 2012年分别获西安交通大学计算机、数学双学士学位和清华大学计算机博士学位,2012-2022年先后在中国科学院自动化研究所任助理研究员、副研究员(2015年)、研究员(2018年)、博导(2020年)、中国科学院大学岗位教授(2021年),2012-2013年在新加坡国立大学做访问学者,2015年在微软亚洲研究院做“铸星计划”访问教授。主要从事视觉智能感知与人机博弈决策研究,发表CCF-A类国际会议和期刊论文60余篇,谷歌学术引用超过15000次、Web of Science他引超过7000次,曾获CCF-A类国际会议ACM Multimedia 2013最佳论文奖、AAAI 2022卓越论文奖、以及CCF-C类会议PRCV 2020最佳论文奖,并数十次在国内外重要技术竞赛中获奖。研究成果在华为、蚂蚁金服等企业形成规模化商业应用,开放了学界首个大规模不完美信息博弈对抗平台OpenHoldem,研发的德扑AI程序AlphaHoldem达到人类专业选手水平,博弈性能超过已公开最好模型DeepStack,速度较之提升超过1000倍。
李凯,中国科学院自动化研究所副研究员,博士毕业于中国科学院自动化研究所模式识别国家重点实验室,师从胡卫明研究员和兴军亮研究员,研究领域为智能博弈、强化学习、深度学习等,中国科学院人工智能创新研究院首批“2035创新团队”核心成员,2020 CCF-腾讯犀牛鸟科研基金优秀奖获得者,中国科学院大学人工智能学院及南京学院《计算博弈原理与应用》课程主讲教师,负责国家自然科学基金、中科院先导专项子课题、科技创新2030-“新一代人工智能”重大项目子课题、国防科技创新特区项目等多项重要科研任务,在包括CCF-A类国际顶级期刊会议(如AAAI、IJCAI、ICLR、ICML、CVPR等)上发表学术论文20余篇,获AAAI 2022卓越论文奖,申请/授权国家发明专利20余项,获2次国际竞赛冠军。