GPU架构与编程
课程编码:180086085404P3003H
英文名称:GPU Architecture and Programming
课时:40
学分:2.00
课程属性:专业课
主讲教师:赵地
教学目的要求
本课程旨在通过介绍GPU构架与编程,特别是GPGPU,运行机理、关键技术及科技发展史,帮助学生建立、贯通GPU构架与编程所需的知识体系,培养学生的GPU构架与编程的能力、系统思维能力和正确的历史唯物主义科技观。
预修课程
数字电路、计算机组成原理、计算机体系结构
大纲内容
第一章 GPU体系结构概述 赵地
第1节 GPU体系结构的研究内容和衡量指标 2学时
第2节 GPU体系结构的发展 1学时
第3节 芯片技术的发展与摩尔定律(Moore's Law) 1学时
第4节 GPU计算加速的度量 1学时
第5节 并行计算部件 1学时
第二章 GPU编程模型 Programming Model 赵地
第1节 执行模型 Execution Model 1学时
第2节 主流GPU指令集架构 1学时
第三章 GPU编程(CUDA编程) 赵地
第1节 CUDA核 0学时
第2节 CUDA线程与线程块 0学时
第3节 内存结构与管理 0学时
第4节 并行管理 0学时
第5节 流 0学时
第6节 CUDA事件 0学时
第7节 多设备系统 0学时
第8节 动态并行(Dynamic Parallelism) 0学时
第9节 统一虚拟地址空间(Unified Virtual Address Space) 0学时
第10节 CUDA的编译 0学时
第四章 CUDA程序优化 赵地
第1节 CUDA程序优化的策略 1学时
第2节 指令级别的优化 0学时
第3节 线程和线程块级别的优化 0学时
第4节 CUDA核级别的优化 0学时
第5节 CUDA程序级别的优化 0学时
第五章 GPU构架:SIMT核心 赵地
第1节 单环路近似 One-Loop Approximation 2学时
第2节 双环路近似 Two-Loop Approximation 2学时
第3节 三环路近似 Three-Loop Approximation 2学时
第4节 有关分支分歧的研究方向 2学时
第5节 有关标量执行和仿射执行的研究方向 2学时
第6节 有关寄存器文件架构的研究方向 2学时
第六章 GPU构架:存储系统 Memory System 赵地
第1节 一级存储结构 1学时
第2节 片上互联网络 1学时
第3节 内存分区单元 1学时
第4节 有关GPU存储系统的研究方向 1学时
参考书
1、
General-Purpose Graphics Processor Architectures@通用图形处理器设计 GPGPU编程模型与架构原理
Tor M. Aamodt/Wilson Wai Lun Fung/Timothy G. Rogers@景乃锋/柯晶/梁晓峣
2013年@2022年
Morgan & Claypool Publishers@清华大学出版社
课程教师信息
赵地,中科院计算所副研究员,硕士生导师。