大数据技术-1班
课程编码:180090125603M2003Y-01
英文名称:Introduction to Big Data Technology
课时:40
学分:2.00
课程属性:专业核心课
主讲教师:吕科
教学目的要求
面向信息技术领域工程管理专业硕士研究生,通过介绍大数据相关的理论基础和实践技术,使学生能够理解大数据的技术原理与应用,掌握当前大数据处理所使用的主流技术和架构,了解大数据的行业应用背景和未来的发展方向,为从事大数据技术与应用研究与开发工作打下基础。主要内容包括大数据技术发展现状、大数据采集及预处理、大数据分析、大数据可视化、大数据存储HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Hadoop与Spark、大数据相关案例等内容。
预修课程
计算机基础
大纲内容
第一章 大数据特征与应用 4.0学时 吕科
第1节 大数据起源
第2节 大数据、云计算与大数据有什么关系
第3节 大数据的4V特征
第4节 大数据未来发展趋势?
第二章 大数据处理与并行计算方法 4.0学时 吕科
第1节 并行计算的发展现状
第2节 并行计算体系结构
第3节 并行算法
第三章 大数据检索与挖掘方法 6.0学时 吕科
第1节 数据挖掘介绍
第2节 数据分类与聚类
第3节 数据挖掘算法综合应用
第四章 消息传递计算MPI 6.0学时 吕科
第1节 MPI标准介绍
第2节 MPI消息传递计算
第3节 MPI大数据处理
第4节 分治法介绍
第五章 MapReduce架构 6.0学时 吕科
第1节 MapReduce特性
第2节 MapReduce的优化
第3节 流水线计算
第六章 PageRank架构 6.0学时 吕科
第1节 网络收缩方法
第2节 PageRank模型
第3节 PageRank计算
第七章 GPU 与CUDA架构 4.0学时 吕科
第1节 GPGPU及CUDA介绍
第2节 CUDA编程模型
第3节 多线程及存储器硬件
第八章 Hadoop与Spark架构 4.0学时 吕科
第1节 Hadoop架构
第2节 HDFS-Hbase架构
第3节 Spark架构
参考书
1、
大数据技术概论
娄岩 徐东雨
2017年1月
清华大学出版社,
课程教师信息
吕科,男,1971年3月生,博士,现为中国科学院大学工程科学学院教授,博士生导师,研究方向为计算机图形学、科学计算可视化。长期从事图像处理和科学计算可视化方面的研究工作,承担国家自然科学基金等相关科研项目多项。