课程大纲

课程大纲

计算博弈原理与应用

课程编码:085400M05024N 英文名称:Computer Gaming: Theory and Applications 课时:50 学分:2.50 课程属性:专业普及课 主讲教师:兴军亮等

教学目的要求
"本课程为计算机、软件、人工智能、信息安全、电子信息等学科研究生的专业普及课。通过本课程学习,希望学生能够对于面向人工智能专业的博弈课程的整体研究框架和主要研究内容有较为全面的了解,理解博弈的基本概念和原理,掌握博弈计算的算法机制和实现方法,并且熟悉计算博弈在实际复杂问题建模和求解中的应用过程和典型案例,为后续从事相关方向的研究奠定一定的基础。
课程要求选课学生为人工智能相关专业,具有较为扎实的数学基础,对于经济学博弈论、计算机算法分析、机器学习等相关研究内容具有一定的了解,同时具有较强的算法编程和动手实践能力。
1. 掌握计算博弈的基本原理,了解智能博弈的常见应用;
2. 积极参与课堂讨论,完成课程相关作业;
3. 任选一个问题,利用所学知识完成一个课程设计。"

预修课程
计算机算法与数据结构、机器学习

大纲内容
第一章 计算博弈课程基础
第1节 课程相关的基本信息 0.3学时
第2节 博弈论发展历史 0.5学时
第3节 计算博弈基础知识 1.2学时
第4节 博弈论应用案例 1.0学时
第二章 完全信息静态博弈
第1节 基本概念和表示 1.0学时
第2节 均衡分析和求解 1.0学时
第3节 均衡存在性讨论 0.5学时
第4节 其他相关的问题 0.5学时
第三章 完全信息动态博弈
第1节 定义及其扩展式表示 1.0学时
第2节 扩展式博弈均衡分析 0.6学时
第3节 子博弈精炼纳什均衡 0.8学时
第4节 重复博弈的均衡问题 0.6学时
第四章 不完全信息静态博弈
第1节 博弈类型介绍和表示 1.0学时
第2节 博弈均衡分析和求解 0.5学时
第3节 贝叶斯博弈应用示例 1.0学时
第4节 混合策略均衡的解释 0.5学时
第五章 不完全信息动态博弈
第1节 精炼贝叶斯纳什均衡 1.0学时
第2节 信号传递博弈及示例 0.8学时
第3节 其他相关的均衡概念 0.6学时
第4节 不完全信息重复博弈 0.6学时
第六章 随机博弈
第1节 博弈类型介绍与表示 0.5学时
第2节 博弈均衡分析与求解 1.0学时
第3节 典型问题建模与讲解 0.8学时
第4节 学习技术应用与示例 0.7学时
第七章 算法化机制设计专题
第1节 算法博弈论概述 0.5学时
第2节 算法化机制设计产生和发展 0.5学时
第3节 案例研究 1.0学时
第4节 麦尔森定理 1.0学时
第八章 均衡的低效率性专题
第1节 自私路由的低效率性 1.0学时
第2节 自私路由的改进措施 0.5学时
第3节 原子自私路由的低效率性 0.5学时
第4节 不同类型的均衡解概念 1.0学时
第九章 均衡计算复杂度专题
第1节 纯纳什均衡求解算法 0.5学时
第2节 粗相关均衡求解算法 1.0学时
第3节 相关均衡求解算法 0.5学时
第4节 均衡计算复杂度分析 1.0学时
第十章 单机小游戏AI设计
第1节 单机小游戏环境介绍 0.5学时
第2节 DQN算法介绍 1.0学时
第3节 后续改进算法介绍 0.5学时
第4节 通用探索学习框架 1.0学时
第十一章 围棋博弈AI设计
第1节 基础知识介绍 1.0学时
第2节 AlphaGo介绍 1.0学时
第3节 AlphaGo Zero介绍 0.6学时
第4节 AlphaZero介绍 0.4学时
第十二章 德扑博弈AI设计
第1节 德州扑克基础知识 1.0学时
第2节 DeepStack德州扑克AI程序 1.0学时
第3节 Libratus德州扑克AI程序 0.5学时
第4节 德州扑克AI总结 0.5学时
第十三章 实时策略游戏AI设计
第1节 多智能体博弈学习基础知识 1.0学时
第2节 星际争霸AI程序AlphaStar 1.0学时
第3节 刀塔AI程序OpenAI Five 0.5学时
第4节 王者荣耀AI程序绝悟 0.5学时
第十四章 课程总结及课程设计汇报1
第1节 已学内容回顾 0.4学时
第2节 重点复习内容 0.3学时
第3节 课程总体总结 0.3学时
第4节 调研类课程设计报告 2.0学时
第十五章 课程设计汇报2
第1节 编程类课程设计报告 3.0学时
第十六章 课程设计汇报3
第1节 预研类课程设计报告 3.0学时
第十七章 闭卷考试
第1节 上半场 1.0学时
第2节 下半场 1.0学时

参考书
1、 机器学习 周志华 2016年1月 清华大学出版社

课程教师信息
"兴军亮,中科院自动化所研究员、博士生导师、特聘青年骨干,中国科学院大学岗位教授、《博弈论》和《计算博弈原理与应用》课程首席教授,中国科学院人工智能创新研究院创新专家组专家。2012年毕业于清华大学计算机科学与技术系,获工学博士学位,2012年12月新加坡国立大学访问研究员,2015年4月微软亚洲研究院 “铸星计划”访问教授。美国电器与电子工程学会(IEEE)高级会员、美国《科学》杂志中国官方公众号特邀评论员、中国计算机学会(CCF)高级会员、计算机视觉专委会委员。主要研究领域为计算机视觉和计算机博弈。目前已在包括顶级国际期刊如TPAMI、IJCV、AI以及顶级国际会议上如ICCV、CVPR、AAAI、IJCAI上发表论文100多篇,谷歌学术引用超过10000次,出版计算机视觉译著2部,参与撰写深度学习领域著作1部、人工智能领域著作1部。曾获清华大学计算机系“学术新秀”、“谷歌学者”、多次顶级国际和国内会议最佳论文奖等荣誉和奖励,以及十余次在人脸识别、车辆识别、视频识别等国际和国内挑战赛中获奖。目前作为项目和课题负责人承担多项国家重点项目,研发的视觉感知相关技术在国家广电总局、华为、微软等得到了多次验证应用和落地推广,取得了良好的经济效益和社会价值。近年来主要围绕深度强化学习相关的智能感知和决策问题,研发了多款针对不同游戏的博弈决策AI,其中研发的星际争霸AI曾获2017年IEEE CIG星际争霸AI第2名,研发的德州扑克AI胜率超过了目前公开的最好德州扑克AI程序DeepStack,速度提升超过1000倍。
主讲教师李凯,中科院自动化所副研究员,毕业于中国科学院自动化研究所模式识别国家重点实验室,获工学博士学位,研究领域为计算机博弈、强化学习、深度学习和计算机视觉,中国科学院人工智能创新研究院首批“2035创新团队”成员,负责多项军委科技委重点项目以及国家自然科学基金项目,作为核心骨干参与了多项科技委“新一代人工智能”重大项目、基金委重点项目及面上项目,在大规模不完美信息博弈、深度强化学习、多智能体系统、智能视觉感知等方面具有丰富的研究和应用经验,申请发明专利20余项,在包括CCF-A类期刊会议上发表论文10余篇,获2次国际智能视觉感知竞赛冠军,近年来围绕深度强化学习相关的智能感知与决策问题,研发了多项针对不同复杂博弈问题的决策AI,并构建了学术界第一个开放的大规模不完美信息博弈研究开放平台OpenHoldem。
主讲教师李丽娟,中科院自动化所副研究员,毕业于清华大学微电子学研究所,获工学博士学位,研究领域为计算机博弈、深度强化学习和信息安全。目前已发表多篇第一作者国际期刊论文和国际会议论文。作为核心骨干参与了多项科技委“新一代人工智能”重大项目、基金委重点项目及面上项目。曾获得党政机要密码科学技术进步二等奖(省部级)、首届全国空中智能博弈大赛二等奖。"