课程大纲

课程大纲

数据挖掘与可视化-R语言实践

课程编码:280223070501P4005 英文名称:Data Mining & Visualization with R 课时:20 学分:1.00 课程属性:研讨课 主讲教师:万荣荣等

教学目的要求
本课程主要介绍R语言在数据挖掘与可视化中的应用,其目的主要是让大家能够利用R语言从数据中得到有趣和有价值的东西。课程围绕完整的数据分析的5个流程(1、获取数据,2、清理数据,3、探索和可视化数据,4、数据建模并预测,5、结果展示)开展,首先将会介绍一些基础的R语言操作,并协助大家养成良好的R语言编程习惯;随后,本课程将展示R语言的完整数据分析流程,并介绍部分实验设计与统计方面的知识;最后,我们会介绍一些比较实用的R语言技巧来帮助大家解决实际问题。

预修课程

大纲内容
第一章 R语言基础 2学时 万荣荣
第1节 R语言基础操作
第2节 良好编程习惯
第3节 tidyverse style
第二章 ggplot2数据可视化 2学时 万荣荣
第1节 ggplot2语法
第2节 ggplot2做图原则
第3节 ggplot2拓展
第三章 如何用R整理数据-tidyverse 2学时 李冰
第1节 tidy data定义
第2节 tidyr和dplyr的使用
第四章 如何用R整理数据-data.table 2学时 李冰
第1节 data.table的使用
第五章 实验设计和R语言(1) 2学时 李冰
第1节 完全随机实验设计
第2节 因子实验设计
第六章 实验设计和R语言(2) 2学时 李冰
第1节 随机区组设计
第2节 裂区实验设计
第七章 使用R语言处理文本数据 2学时 李冰
第1节 stringr的使用
第2节 正则表达式
第八章 使用R语言处理遥感数据 2学时 李冰
第1节 raster的使用
第2节 sp的使用
第3节 gdal的使用
第九章 如何给R语言提速 2学时 李冰
第1节 矢量化
第2节 并行化
第3节 profvis的使用
第十章 R语言与深度学习 2学时 万荣荣
第1节 keras框架部署
第2节 MNIST数据识别
第3节 LSTM构建

参考书

课程教师信息
万荣荣,中国科学院南京地理与湖泊研究所副研究员,从事流域土地利用与生态环境效应、流域生态水文、流域生态评估等方面研究工作,对于R语言统计分析与建模具有较深造诣,主持国家自然科学基金3项、国家重点研发课题1项,发表学术论文100余篇;
李冰,中国科学院南京地理与湖泊研究所副研究员,主要从事环境生态数据统计建模、数据挖掘等工作,主持国家自然科学基金2项,重点研发子课题1项,发表学术论文40余篇。