课程大纲

课程大纲

高能物理实验的大数据管理技术

课程编码:082700M02012H 英文名称:Big Data Management Technologies in High Energy Physics 课时:36 学分:2.00 课程属性:一级学科普及课 主讲教师:程耀东等

教学目的要求
本课程结合多个高能物理实验的数据管理系统实践,全面介绍高能物理领域的科学数据管理技术,包括数据管理体系架构、基于磁盘和磁带的海量存储系统、跨地域的分布式数据管理、面向事例的数据库、数据保存和开放共享以及机器学习在数据管理中的应用等,引导学生理解数据管理的需求和科学数据管理系统的设计思想,灵活利用课程中的相关工具、技术和解决方案,解决高能物理大科学工程中的实际数据管理问题,为未来的工作奠定坚实的专业基础。

预修课程

大纲内容
第一章 大数据基础 2学时
第1节 大数据基础
第二章 大数据管理体系架构 2学时
第1节 大数据管理体系架构
第三章 数据中心管理 2学时
第1节 数据中心管理
第四章 存储设备及特性 2学时
第1节 存储设备及特性
第五章 习题上机课:ROOT安装与使用 2学时
第1节 习题上机课:ROOT安装与使用
第六章 磁盘阵列技术与网络存储架构 2学时
第1节 磁盘阵列技术与网络存储架构
第七章 分布式文件系统技术 2学时
第1节 分布式文件系统技术
第八章 分布式存储系统实例 2学时
第1节 分布式存储系统实例
第九章 Xrootd框架原理及使用 2学时
第1节 Xrootd框架原理及使用
第十章 习题上机课:Xrootd的安装及使用 2学时
第1节 习题上机课:Xrootd的安装及使用
第十一章 跨地域数据管理系统实例 2学时
第1节 跨地域数据管理系统实例
第十二章 高能物理数据长期保存与开放 2学时
第1节 高能物理数据长期保存与开放
第十三章 事例与元数据管理 2学时
第1节 事例与元数据管理
第十四章 基于机器学习的海量存储智能化运维 2学时
第1节 基于机器学习的海量存储智能化运维
第十五章 习题上机课:深度学习技术 2学时
第1节 习题上机课:深度学习技术
第十六章 流数据处理技术 2学时
第1节 流数据处理技术
第十七章 存储发展趋势及存储先进技术 2学时
第1节 存储发展趋势及存储先进技术
第十八章 考试:读书报告 2学时
第1节 考试:读书报告

参考书
1、 网络计算环境:数据管理 程耀东 2014年10月 科学出版社

课程教师信息
程耀东,中国科学院高能物理研究所研究员;一直从事高能物理计算相关的研究工作,包括海量实验数据的存储和处理、云计算与大数据技术在高能物理中的应用等;在国内外学术刊物上发表论文30多篇,共同申请国家发明专利7项。汪璐,高能物理研究所副研究员;一直从事高能物理数据管理相关的研究和运维工作,包括海量存储架构及性能优化,云计算与大数据技术、机器学习在高能物理中的应用等;在国内外学术期刊发表论文10多篇,申请国家发明专利3项。
专业背景:
2004年毕业于北京科技大学计算机科学与技术专业,获工学学士学位;2007年毕业于中国科学院高能物理研究所核技术与应用专业,获工学硕士学位;2011年毕业于中国科学院高能物理研究所计算机应用技术专业,获得博士学位。
教学经历:
目前培养硕士研究生1名,2011年、2014年、2016年在高能所与其他老师共同开设博士生自学辅导课“高能物理中的科学计算系列讲座”。曾经在高能所合作单位范围内组织过深度学习技术系列讲座。
教学准备:
熟悉高能物理实验数据存储和管理技术并工作在科研一线,具有丰富的经验,面向各实验对学生计算机技能培养的实际需求,认真编写教学大纲、教案、习题及上机实践等,教学阶段将投入主要精力和时间细致做好各项教学前准备。