智能博弈方法与案例
课程编码:280223085410P3003
英文名称:Intelligent Gaming Methods and Case Studies
课时:50
学分:2.50
课程属性:专业课
主讲教师:张一帆等
教学目的要求
本课程为计算机、软件、人工智能、信息安全、电子信息等学科研究生的专业普及课。通过本课程学习,希望学生能够对于面向人工智能专业的博弈课程的整体研究框架和主要研究内容有较为全面的了解,理解博弈的基本概念和原理,掌握博弈计算的算法机制和实现方法,并且熟悉智能博弈在实际复杂问题建模和求解中的应用过程和典型案例,为后续从事相关方向的研究奠定一定的基础。
课程要求选课学生为人工智能相关专业,具有较为扎实的数学基础,对于经济学博弈论、计算机算法分析、机器学习等相关研究内容具有一定的了解,同时具有较强的算法编程和动手实践能力。
1. 掌握智能博弈的基本原理,了解智能博弈的常见应用;
2. 积极参与课堂讨论,完成课程相关作业;
3. 任选一个问题,利用所学知识完成一个课程设计。
预修课程
计算机算法与数据结构、机器学习
大纲内容
第一章 智能博弈课程基础 3学时 张一帆
第1节 课程相关的基本信息
第2节 博弈论发展历史
第3节 智能博弈基础知识
第4节 博弈论应用案例
第二章 完全信息静态博弈 3学时 张一帆
第1节 基本概念和表示
第2节 均衡分析和求解
第3节 均衡存在性讨论
第4节 其他相关的问题
第三章 完全信息动态博弈 3学时 张一帆
第1节 定义及其扩展式表示
第2节 扩展式博弈均衡分析
第3节 子博弈精炼纳什均衡
第4节 重复博弈的均衡问题
第四章 不完全信息静态博弈 3学时 李凯
第1节 博弈类型介绍和表示
第2节 博弈均衡分析和求解
第3节 贝叶斯博弈应用示例
第4节 混合策略均衡的解释
第五章 不完全信息动态博弈 3学时 李凯
第1节 精炼贝叶斯纳什均衡
第2节 信号传递博弈及示例
第3节 其他相关的均衡概念
第4节 不完全信息重复博弈
第六章 随机博弈 3学时 李凯
第1节 博弈类型介绍与表示
第2节 博弈均衡分析与求解
第3节 典型问题建模与讲解
第4节 学习技术应用与示例
第七章 算法化机制设计专题 3学时 李凯
第1节 算法博弈论概述
第2节 算法化机制设计产生和发展
第3节 案例研究
第4节 麦尔森定理
第八章 均衡的低效率性专题 3学时 李凯
第1节 自私路由的低效率性
第2节 自私路由的改进措施
第3节 原子自私路由的低效率性
第4节 不同类型的均衡解概念
第九章 均衡计算复杂度专题 3学时 李凯
第1节 纯纳什均衡求解算法
第2节 粗相关均衡求解算法
第3节 相关均衡求解算法
第4节 均衡计算复杂度分析
第十章 单机小游戏AI设计 3学时 张一帆
第1节 单机小游戏环境介绍
第2节 DQN算法介绍
第3节 后续改进算法介绍
第4节 通用探索学习框架
第十一章 围棋博弈AI设计 3学时 张一帆
第1节 基础知识介绍
第2节 AlphaGo介绍
第3节 AlphaGo Zero介绍
第4节 AlphaZero介绍
第十二章 德扑博弈AI设计 3学时 李凯
第1节 德州扑克基础知识
第2节 DeepStack德州扑克AI程序
第3节 Libratus德州扑克AI程序
第4节 德州扑克AI总结
第十三章 实时策略游戏AI设计 3学时 李凯
第1节 多智能体博弈学习基础知识
第2节 星际争霸AI程序AlphaStar
第3节 刀塔AI程序OpenAI Five
第4节 王者荣耀AI程序绝悟
第十四章 课程总结及课程设计汇报1 3学时 李凯
第1节 已学内容回顾
第2节 重点复习内容
第3节 课程总体总结
第4节 调研类课程设计报告
第十五章 课程设计汇报2 3学时 李凯
第1节 编程类课程设计报告
第十六章 课程设计汇报3 3学时 李凯
第1节 预研类课程设计报告
第十七章 闭卷考试 2学时 李凯
第1节 上半场
第2节 下半场
参考书
1、
A Course in Game Theory
Martin Osborne and Ariel Rubinstein
1994年6月
MIT Press
2、
博弈论与信息经济学
张维迎
2012年4月
格致出版社
3、
Twenty Lectures on Algorithmic Game Theory
Tim Roughgarden
2016年8月
Cambridge University Express
4、
Game Theory and Mechanism Design
Y. Narahari
2014年3月
IISc Press and World Scientific
5、
Reinforcement Learning: An Introduction (2nd Ed.)
Richard S. Sutton and Andrew G. Barto
2018年11月
MIT Press
6、
Deep Learning
Yoshua Bengio、Ian J. Goodfellow and Aaron Courville
2017年10月
MIT Press
7、
机器学习
周志华
2016年1月
清华大学出版社
课程教师信息
张一帆,中国科学院自动化研究所研究员、博士生导师、中国科学院大学岗位教授。2004年毕业于东南大学自动控制系,获工学学士学位;2010年毕业于中国科学院自动化研究所模式识别国家重点实验室,获工学博士学位。主要研究方向包括视觉内容分析与高效计算、决策智能、AI for Science等。作为项目负责人承担2030新一代人工智能国家科技重大专项课题1项、中国科学院战略性先导科技专项(A类)课题1项、国家自然科学基金项目4项。在IEEE T-PAMI、IEEE T-IP、IEEE T-CYB、IEEE T-MM等权威国际期刊和NeurIPS、ICML、CVPR、ICCV等顶级国际会议上发表论文60余篇。曾先后获中国图象图形学学会自然科学一等奖、中国科学院院长奖,入选中国科学院青年创新促进会成员、中国科学院特聘研究骨干。
李凯,中国科学院自动化研究所项目研究员,硕士生导师,研究领域为强化学习、大模型、AI4Science等,负责国家自然科学基金、中国科学院战略性先导科技专项课题、新一代人工智能国家科技重大专项子课题等多项重要科研任务,同时获CCF-腾讯犀牛鸟基金、CCF-百度松果基金等知名校企合作项目支持,在包括CCF-A类期刊会议(如Artificial Intelligence、NeurIPS、ICML、ICLR、AAAI、IJCAI等)上发表学术论文40余篇,长期担任NeurIPS、ICLR等AI顶级会议领域主席(Area Chair),获CCF-A类会议AAAI 2022卓越论文奖,获2020 CCF-腾讯犀牛鸟科研基金优秀奖,申请/授权国家发明专利20余项,获多次国际竞赛冠军。