大数据技术
课程编码:180203085412P3003H
英文名称:Big Data Technology
课时:40
学分:2.00
课程属性:专业课
主讲教师:钟进文
教学目的要求
本课程主要讲授大数据存储、管理、计算的概念、方法、模型、原理和新技术。课程的目的和任务是:使学生通过本课程的学习,系统地掌握大数据管理相关的理论和方法,了解领域前沿动态,为今后在相关领域开展研究工作打下坚实基础。
预修课程
《程序设计语言》、《数据结构》
大纲内容
第一章 绪论 3学时 钟进文
第1节 课程内容与安排
第2节 课程背景与研究问题
第3节 大数据管理分析概述
第二章 分布式文件系统 3学时 钟进文
第1节 文件系统概述
第2节 分布式文件系统
第3节 HDFS文件系统实例
第三章 关系数据模型与系统 6学时 钟进文
第1节 数据库发展历史发展趋势
第2节 关系模型与SQL
第3节 数据库的实现原理
第4节 分布式数据库的架构
第5节 数据的存储组织
第四章 键值对数据模型与系统 3学时 钟进文
第1节 键值对数据模型与查询
第2节 分布式键值数据库架构
第3节 数据的组织存储
第4节 键值对系统实例分析
第五章 文档模型与管理系统 3学时 钟进文
第1节 文档模型及查询语言
第2节 分布式文档管理系统架构
第3节 数据的组织存储
第4节 文档管理系统实例分析
第六章 图模型与管理系统 3学时 钟进文
第1节 图数据模型与查询语言
第2节 分布式图数据库架构
第3节 数据的组织存储
第4节 图数据管理系统实例分析
第七章 分布式事务与故障恢复 3学时 钟进文
第1节 分布式事务
第2节 一致性协议
第3节 实例系统分析
第八章 分布式存储与查询优化技术 6学时 钟进文
第1节 重复数据删除技术
第2节 大数据存储纠删码技术
第3节 数据的查询优化技术
第4节 新硬件查询加速技术
第九章 大数据处理 6学时 钟进文
第1节 离线计算技术
第2节 流式计算技术
第3节 内存计算技术
第4节 图计算技术
第十章 总结考试 4学时 钟进文
第1节 课程总结
第2节 课程报告
教材信息
1、
大数据管理
杜小勇
2019年3月
高等教育出版社
参考书
1、
大数据处理
金海、石宣化
43435
高等教育出版社
课程教师信息
钟进文,博士,高级工程师。主要研究方向为大数据管理、时空数据分析。作为课题负责人主持多项国家部委重大工程项目建设,作为核心骨干参与多项国家863计划、国家242信息安全计划项目、重点研发计划。作为核心成员参与自研大数据管理系统,参与国家部委多个PB级大数据管理平台建设,支撑多领域关键业务。