无人系统自主决策与优化
课程编码:180206081101P3007H
英文名称:Autonomous Decision Making and Optimization of Unmanned Systems
课时:40
学分:2.00
课程属性:专业课
主讲教师:魏庆来等
教学目的要求
掌握自学习优化决策基础理论与方法
预修课程
高等数学
大纲内容
第一章 绪论 2学时 魏庆来
第1节 绪论
第2节 Review Of Matrix Algebra
第二章 静态优化 4学时 宋睿卓
第1节 无约束优化
第2节 具有相等约束的优化
第3节 数值求解方法
第三章 离散时间系统的最优控制 4学时 魏庆来
第1节 一般离散时间优化问题的求解
第2节 离散时间线性二次调节器
第四章 连续时间系统的最优控制 4学时 宋睿卓
第1节 变异微积分
第2节 一般连续时间优化问题的求解
第3节 连续时间线性二次调节器
第4节 稳态闭环控制和次优反馈
第五章 动态规划 4学时 魏庆来
第1节 贝尔曼最优原理
第2节 离散时间系统
第3节 连续时间系统
第六章 差分对策 6学时 宋睿卓
第1节 利用Pontryagin最小原理和Bellman方程导出的最优控制
第2节 两人零和博弈
第3节 零和对策在H∞控制中的应用
第4节 多人非零和游戏
第七章 强化学习 6学时 魏庆来
第1节 简介
第2节 马尔可夫决策过程
第3节 动态编程
第4节 政策评估和政策改进
第5节 广义政策迭代
第6节 实施PI和VI的方法
第八章 自适应动态规划 10学时 魏庆来
第1节 自适应动态规划简介
第2节 离散时间系统的最优控制
第3节 使用积分强化学习的线性系统最优自适应控制
参考书
1、
3Rd Edition
Frank Lewis
2013年06月
Wiley
课程教师信息
魏庆来,中国科学院自动化研究所研究员,博士生导师,复杂系统管理与控制国家重点实验室副主任,中国自动化学会理事,国际神经网络学会理事。国家优秀青年基金获得者。主要从事人工智能、自学习最优控制,平行控制,复杂系统自演化、自适应动态规划及其工业应用等研究工作。目前发表/录用论文120余篇,出版专著6部。研究成果获得IEEE Transactions on Neural Networks and Learning Systems Outstanding Paper Award,IEEE System, Man, and Cybernetics Society, Andrew P. Sage Best Transactions Paper Award,中国产学研合作创新奖,中国自动化学会青年科学家奖,中国自动化学会杨嘉墀科技奖,亚太神经网络学会青年学者奖,2015年张嗣瀛优秀青年论文奖等10余项奖励。入选2018年-2019年全球高被引科学家。共担任13本期刊编委包括6本IEEE期刊编委。研究成果应用于实际建筑智能节能监管系统中,获得经济效益1100余万元。担任IEEE CIS Beijing Chapter, Secretary。在DDCLS2020,ICONIP 2018,ISNN2017,ICONIP 2017,WCICA 2016,WCCI2014等14项国际相关领域学术会议上担任重要职务。现任中国科学院大学岗位教授,曾经讲述《最优控制》,《智能自学习系统优化与决策》课程,现无教学任务。