课程大纲

课程大纲

数据科学导论

课程编码:180086081202PX004H 英文名称:Introduction to Data Science 课时:40 学分:1.00 课程属性:公共选修课 主讲教师:刘玉贵

教学目的要求
本课程结合Python语言,介绍与数据科学相关的基础知识,内容主要包括:多维数据的建模与分析、数据存储和管理、机器学习和神经网络建模技术、文本、图像和语音数据的处理技术,最后介绍大数据的基本技术。
通过本课程的学习,能够让学生掌握数据科学的基本理论和基本方法,提高学生解决实际问题的动手能力,培养学生的数据思维。

预修课程

大纲内容
第一章 数据科学基础 刘玉贵
第1节 数据科学概述 0.2学时
第2节 数据科学的关键技术 0.2学时
第3节 Python数据分析工具 0.6学时
第二章 数据统计与可视化 刘玉贵
第1节 多维数组对象和运行 1.0学时
第2节 数据汇总与统计 1.0学时
第3节 数据可视化 1.0学时
第三章 数据存储与管理 刘玉贵
第1节 数据管理的初始阶段—文件管理 1.0学时
第2节 关系数据库管理系统 4.0学时
第3节 NoSQL数据库 1.0学时
第四章 机器学习建模分析 刘玉贵
第1节 机器学习概述 1.0学时
第2节 回归分析 1.0学时
第3节 分类分析 1.0学时
第4节 聚类分析 1.0学时
第5节 数据降维 1.0学时
第6节 集成学习 1.0学时
第五章 神经网络与深度学习建模分析 刘玉贵
第1节 神经网络概述 2.0学时
第2节 深度学习 6.0学时
第六章 文本数据处理 刘玉贵
第1节 文本处理概述 1.0学时
第2节 中文文本处理 5.0学时
第七章 图像数据处理 刘玉贵
第1节 数字图像概述 0.5学时
第2节 Python图像处理 0.5学时
第3节 深度学习实现图像分类 1.0学时
第八章 时序数据与语音处理 刘玉贵
第1节 时序数据概述 0.5学时
第2节 时序数据分析方法 0.5学时
第3节 语音识别技术 1.0学时
第九章 大数据技术 刘玉贵
第1节 大数据概述 1.0学时
第2节 分布式计算框架 3.0学时
第3节 分布式建模分析工具 2.0学时

参考书

课程教师信息
刘玉贵,男,1962.02月生,副教授。北京大学数学系,应用数学学士,中国科技大学计算机系,工学硕士。曾教授课程:多媒体计算机技术、分布式多媒体计算机系统、流媒体与视频服务器、数据库系统基础、计算机算法设计与分析。工作经历:1984-1997 北京玻璃研究院,从事工业自动化、管理信息系统应用开发;1997- 今,中国科学院大学,教学科研,研究方向:计算机应用、多媒体技术。科研成果:曾获得原轻工业部科技进步三等奖,名次第二,北京市科技进步二等奖,名次第二,核心期刊、会议论文20余篇。