课程大纲

课程大纲

数据挖掘与可视化-R语言实践

课程编码:070501M06003N 英文名称:Data mining & visualization with R 课时:20 学分:1.00 课程属性:专业研讨课 主讲教师:吴华武等

教学目的要求
本课程主要介绍R语言在数据挖掘与可视化中的应用,其目的主要是让大家能够利用R语言从数据中得到有趣和有价值的东西。课程围绕完整的数据分析的5个流程(1、获取数据,2、清理数据,3、探索和可视化数据,4、数据建模并预测,5、结果展示)开展,首先将会介绍一些基础的R语言操作,并协助大家养成良好的R语言编程习惯;随后,本课程将展示R语言的完整数据分析流程,并介绍部分实验设计与统计方面的知识;最后,我们会介绍一些比较实用的R语言技巧来帮助大家解决实际问题。

预修课程

大纲内容
第一章 R语言基础 2学时
第1节 R语言基础操作
第2节 良好编程习惯
第3节 tidyverse style
第二章 ggplot2数据可视化 2学时
第1节 ggplot2语法
第2节 ggplot2做图原则
第3节 ggplot2拓展
第三章 如何用R整理数据-tidyverse 2学时
第1节 tidy data定义
第2节 tidyr和dplyr的使用
第四章 如何用R整理数据-data.table 2学时
第1节 data.table的使用
第五章 实验设计和R语言(1) 2学时
第1节 完全随机实验设计
第2节 因子实验设计
第六章 实验设计和R语言(2) 2学时
第1节 随机区组设计
第2节 裂区实验设计
第七章 使用R语言处理文本数据 2学时
第1节 stringr的使用
第2节 正则表达式
第八章 使用R语言处理遥感数据 2学时
第1节 raster的使用
第2节 sf的使用
第3节 gdal的使用
第九章 如何给R语言提速 2学时
第1节 矢量化
第2节 并行化
第3节 profvis的使用
第十章 R语言与深度学习 2学时
第1节 keras框架部署
第2节 MNIST数据识别
第3节 LSTM构建

参考书

课程教师信息
吴华武,男,35岁,副研究员,研究方向为湖泊流域同位素生态水文。主持了国家自然科学基金面上项目和青年项目,基于湖泊流域水文过程和生态系统的长期野外观测