Python数据分析
课程编码:480139081202PX008
英文名称:Python for Data Analysis
课时:40
学分:1.00
课程属性:公共选修课
主讲教师:孙维鹏
教学目的要求
本课程是关于数据分析的公共选修课。课程主要通过案例,讲授基于Python编程语言的常用数据分析软件包,目的是让学生将Python语言和数据分析工具运用到科研数据的预处理、统计分析与展示、特征提取和数据建模中。
预修课程
高等数学、线性代数,概率论与数理统计,Python
大纲内容
第一章 第一章 概述 3.0学时 孙维鹏
第1节 1.1 数据分析概述
第2节 1.2 Python语言基础
第3节 1.3 开发环境配置
第二章 第二章 数据装载和存储 6.0学时 孙维鹏
第1节 2.1 数据文件格式
第2节 2.2 Numpy:数组及计算
第3节 2.3 Pandas基础
第4节 2.4 pickle模块的运用
第三章 第三章 数据探索性分析和可视化 6.0学时 孙维鹏
第1节 3.1 数据分析常用统计量
第2节 3.2 Matplotlib、Seaborn、Pandas常用绘图函数
第3节 3.3 数值型数据探索性分析和可视化
第4节 3.4 类别型数据探索性分析和可视化
第四章 第四章 数据清洗 6.0学时 孙维鹏
第1节 4.1 数据缺失值处理
第2节 4.2 异常数据点检测和处理
第3节 4.3 重复数据处理
第4节 4.4 字符串数据处理
第五章 第五章 数据聚合和分组 3.0学时 孙维鹏
第1节 5.1 数据分组
第2节 5.2 数据聚合
第3节 5.3 交叉表和透视表
第六章 第六章 数据预处理和特征提取 3.0学时 孙维鹏
第1节 6.1 数值型数据特征提取
第2节 6.2 类别型特征提取
第3节 6.3 简单文本特征提取
第七章 第七章 数据建模 8.0学时 孙维鹏
第1节 7.1 数据建模概述
第2节 7.2 Scikit-Learn工具包简介
第3节 7.3聚类
第4节 7.4 降维
第5节 7.5 分类
第6节 7.6 回归
第八章 第八章 时序数据建模 3.0学时 孙维鹏
第1节 8.1 日期和时间类型数据及其基本操作
第2节 8.2 自回归模型
第3节 8.3循环神经网络模型
参考书
课程教师信息
吉林大学孙维鹏教授讲授