课程大纲

课程大纲

高级数据管理

课程编码:083500M03001H 英文名称:Advanced Data Management 课时:20 学分:1.00 课程属性:一级学科研讨课 主讲教师:徐俊刚

教学目的要求
本课程是为软件工程及相关专业研究生开设的专业研讨课,其目的是使学生初步掌握高级数据管理的基本内容,并了解其应用领域。本课程聚焦高级数据管理的几个主题集中讲授和讨论,对学生的要求包括:熟练掌握高级数据管理中图数据、流数据的基本概念、设计方法以及当前主流的大数据平台、大数据主流应用,通过研讨使软件工程及相关专业研究生深入掌握高级数据管理领域的科研动向、最新技术和工具,对当前主要应用有初步了解。培养研究生的研究和开发能力,开阔眼界,为将来的研究与应用打好基础。

预修课程
数据库系统原理

大纲内容
第一章 图数据
第1节 RDF与知识图谱 1学时
第2节 SparQL查询语言 1学时
第3节 图数据库 1学时
第4节 图计算工具 1学时
第二章 流数据
第1节 流数据基本概念、处理方法 1学时
第2节 流数据平台Flink 1学时
第3节 流数据平台Storm 1学时
第4节 流数据工具SparkStreaming 1学时
第三章 大数据管理平台
第1节 大数据的基本概念、管理技术 1学时
第2节 大数据管理平台Hadoop 1学时
第3节 大数据管理平台Spark 1学时
第4节 大数据管理平台Cloudera 1学时
第四章 主流大数据管理工具
第1节 Redis 1学时
第2节 kafka 1学时
第3节 MongoDB 1学时
第4节 Kudu 1学时
第五章 大数据典型应用
第1节 大数据在科学计算中的应用 1学时
第2节 大数据在医疗领域的应用 1学时
第3节 大数据在金融领域的应用 1学时
第4节 大数据在工业领域的应用 1学时

参考书
1、 大数据架构详解:从数据获取到深度学习 朱洁等 2016 电子工业出版社

课程教师信息
徐俊刚,男,中国科学院大学教授/博士生导师,云计算与智能信息处理实验室主任,国家科技专家库专家,北京市科学技术委员会专家。中国计算机学会数据库专委会委员,中国计算机学会人工智能与模式识别专委会委员,中国计算机学会中文信息技术专委会委员,中国人工智能学会智能服务专委会委员。主持国家科技支撑计划课题、国家重点研发计划子课题、国家自然科学基金面上项目等国家级科研项目,主持北京市科技计划课题、北京市自然科学基金等省部级科研项目,发表论文50余篇,出版著作3部,申请专利5项,2016年度中国科学院朱李月华优秀教师奖获得者。