并行计算与实现技术
课程编码:180206085410M3016Y
英文名称:Parallel Computing and Implementation Technology
课时:40
学分:2.00
课程属性:专业课
主讲教师:缪青海
教学目的要求
本课程讨论并行计算的基本原理、概念、定理,重点讲授并行算法的分析及其在特定并行硬件架构(多核CPU、CPU集群、GPU)下的实现、分析调试和运行,培养学生在并行计算领域的实践能力。通过本课程的学习,要求学生理解并行计算的基本原理,掌握常见并行架构下的并行程序实现技术(OpenMP、MPI和CUDA),掌握并行程序的性能分析方法,基于华为鲲鹏CPU集群和英伟达GPU完成案例设计和实验。
预修课程
程序设计语言、操作系统、计算机网络、计算机算法设计与分析
大纲内容
第一章 并行计算简介 4.0学时 缪青海
第1节 课程概述
第2节 并行计算发展概述
第3节 并行计算-硬件架构基础
第4节 并行计算-软件算法基础
第二章 共享存储并行编程OpenMP 8.0学时 缪青海
第1节 OpenMP核心特性
第2节 OpenMP线程同步
第3节 OpenMP数据属性
第4节 OpenMP链表遍历
第5节 OpenMP蒙特卡洛法实现
第6节 OpenMP编程实践
第三章 消息传递接口编程MPI 10.0学时 缪青海
第1节 MPI编程模型基础
第2节 MPI非阻塞通讯
第3节 MPI数据类型
第4节 MPI虚拟拓扑
第5节 MPI-RMA
第6节 MPI-并行I/O
第7节 MPI超算中心案例
第8节 并行程序性能分析工具-TAU
第9节 并行计算可视化工具-ParaView
第10节 MPI编程实践
第四章 大规模并行处理器编程CUDA 18.0学时 缪青海
第1节 并行加速器与GPU基础
第2节 CUDA编程模型
第3节 CUDA统一内存模型
第4节 CUDA可扩展并行计算
第5节 CUDA内存架构与数据
第6节 CUDA性能优化
第7节 CUDA并行模式-卷积
第8节 CUDA并行模式-稀疏矩阵
第9节 CUDA应用-机器学习
第10节 CUDA张量核心与混合精度计算
第11节 CUDA综合实践-1
第12节 CUDA综合实践-2
教材信息
1、
并行计算与实现技术
迟学斌
2015年6月
科学出版社
参考书
1、
鲲鹏处理器架构与编程
戴志涛
2020年9月
清华大学出版社
课程教师信息
缪青海,博士,中国科学院大学人工智能学院副教授。主要从事计算智能方法研究与应用。先后主持自然科学基金1项,国家科技重大专项子课题2项,在国际知名期刊和会议上发表论文40余篇。