课程大纲

课程大纲

数据挖掘与可视化-R语言实践

课程编码:280223070501P4005 英文名称:Data Mining & Visualization with R 课时:20 学分:1.00 课程属性:研讨课 主讲教师:吴华武等

教学目的要求
本课程主要介绍R语言在数据挖掘与可视化中的应用,其目的主要是让大家能够利用R语言从数据中得到有趣和有价值的东西。课程围绕完整的数据分析的5个流程(1、获取数据,2、清理数据,3、探索和可视化数据,4、数据建模并预测,5、结果展示)开展,首先将会介绍一些基础的R语言操作,并协助大家养成良好的R语言编程习惯;随后,本课程将展示R语言的完整数据分析流程,并介绍部分实验设计与统计方面的知识;最后,我们会介绍一些比较实用的R语言技巧来帮助大家解决实际问题。

预修课程

大纲内容
第一章 R语言基础 2.0学时 吴华武
第1节 R语言基础操作
第2节 良好编程习惯
第3节 tidyverse style
第二章 ggplot2数据可视化 2.0学时 吴华武
第1节 ggplot2语法
第2节 ggplot2做图原则
第3节 ggplot2拓展
第三章 如何用R整理数据-tidyverse 2.0学时 吴华武
第1节 tidy data定义
第2节 tidyr和dplyr的使用
第四章 如何用R整理数据-data.table 2.0学时 吴华武
第1节 data.table的使用
第五章 实验设计和R语言(1) 2.0学时 吴华武
第1节 完全随机实验设计
第2节 因子实验设计
第六章 实验设计和R语言(2) 2.0学时 吴华武
第1节 随机区组设计
第2节 裂区实验设计
第七章 使用R语言处理文本数据 2.0学时 吴华武
第1节 stringr的使用
第2节 正则表达式
第八章 使用R语言处理遥感数据 2.0学时 吴华武
第1节 raster的使用
第2节 sp的使用
第3节 gdal的使用
第九章 如何给R语言提速 2.0学时 吴华武
第1节 矢量化
第2节 并行化
第3节 profvis的使用
第十章 R语言与深度学习 2.0学时 吴华武
第1节 keras框架部署
第2节 MNIST数据识别
第3节 LSTM构建

参考书

课程教师信息
吴华武,男,35岁,副研究员,研究方向为湖泊流域同位素生态水文。主持了国家自然科学基金面上项目和青年项目,基于湖泊流域水文过程和生态系统的长期野外观测,主要成果:(1)揭示了湖泊流域水文循环与湖泊水量平衡变化机制;(2)识别了湖泊流域水体同位素变化特征与转化过程;(3)揭示了湖泊流域生态脆弱区典型植被对土壤水分变化的生态适应机制。部分研究成果已在国内外相关学术期刊上发表。目前,以第一作者身份发表论文20余篇,其中SCI论文16篇。在本项目中主要负责湖泊湿地水量平衡机制分析。