R语言生信分析
课程编码:280216071000M0001
英文名称:An Introductory Guide to Bioinformatics Analysis in R
课时:20
学分:1.00
课程属性:高级强化课
主讲教师:贾俊波
教学目的要求
本课题旨在教授R编程语言基础知识,培养学生利用R语言进行生物信息学数据分析,提高他们的实际应用能力和创新思维;教学要求则强调理论与实践相结合,注重案例分析,培养严谨的数据分析态度。
教学目的:
1.掌握R语言基础知识:使学生能够熟练掌握R语言的基本语法、数据结构和常用函数,为后续的生物信息学数据分析奠定坚实的基础。
2.培养生物信息学数据分析能力:通过课程的学习,使学生能够运用R语言进行生物信息学数据的读取、预处理、统计分析及可视化,掌握生物信息学数据分析的基本流程和方法。
3.提高实际应用能力:通过实践项目和案例分析,使学生能够将所学知识应用于实际生物信息学研究中,提高解决实际问题的能力。
教学要求:
1.理论知识与实践相结合:教学过程中应注重理论知识的讲解和实践操作的结合,使学生能够在理解理论知识的基础上,通过实践操作加深对知识的理解和掌握。
2.注重案例分析:通过引入实际生物信息学案例,使学生能够了解数据分析的实际应用背景和需求,提高解决实际问题的能力。
3.强调数据分析的严谨性:要求学生在进行生物信息学数据分析时,遵循科学的方法和规范,确保数据的准确性和可靠性。
预修课程
1.计算机基础:R语言是一门编程语言,学生需要具有一定的计算机操作能力。学生应熟悉计算机的基本操作,包括文件管理、命令行操作等。此外,对于编程和数据处理的基本概念有所了解也是有帮助的。
2.统计学基础:生物信息学数据分析往往涉及大量的统计方法和原理。因此,学生需要预先学习统计学的基础知识,包括描述性统计、概率论、推断性统计等。这将有助于学生在后续课程中更好地理解和应用R语言进行生物信息学数据的统计分析
3.生物学基础知识:学生需要具备基本的生物学知识,包括遗传学、分子生物学、基因组学等方面的基本概念和原理。这些基础知识有助于学生理解生物信息学数据的来源、意义和应用背景。
大纲内容
第一章 R语言介绍 1.5学时 贾俊波
第1节 为什么是R
第2节 R和RStudio的安装
第3节 包
第二章 创建数据集 1.5学时 贾俊波
第1节 数据结构
第2节 数据的输入
第3节 处理数据对象的实用函数
第三章 数据管理 1.5学时 贾俊波
第1节 变量操作
第2节 数据集操作
第3节 缺失值与异常值
第4节 控制流
第5节 自定义函数
第四章 统计分析 1.0学时 贾俊波
第1节 描述性统计分析
第2节 假设性检验
第五章 使用ggplot2进行绘图 2.0学时 贾俊波
第1节 ggplot2包介绍
第2节 指定图的类型
第3节 修改图形外观
第4节 保存图形
第六章 回归 1.5学时 贾俊波
第1节 线性回归
第2节 广义线性回归
第3节 Logistic回归
第七章 方差分析 1.0学时 贾俊波
第1节 单因素方差分析
第2节 双因素方差分析
第八章 主成分分析和因子分析 1.0学时 贾俊波
第1节 主成分分析
第2节 因子分析
第九章 聚类 1.0学时 贾俊波
第1节 层次聚类
第2节 K均值聚类
第十章 分类 2.0学时 贾俊波
第1节 逻辑回归
第2节 决策树
第3节 随机森林
第4节 支持向量机
第十一章 转录组学数据分析 2.0学时 贾俊波
第1节 数据预处理
第2节 可视化
第3节 细胞分群
第4节 轨迹推断
第十二章 代谢组学数据分析 2.0学时 贾俊波
第1节 数据前处理
第2节 模式识别
第3节 统计分析
第4节 标志物鉴定和通路分析
第十三章 期末考核 2.0学时 贾俊波
第1节 期末考核
教材信息
1、
R语言实战(第3版)
(美)罗伯特·I.卡巴科弗
2023年5月
人民邮电出版社
参考书
1、
R语言数据可视化:科技图表绘制
芯智,龙胜
清华大学出版社
2024年1月
2、
R语言医学数据分析实战
赵军
人民邮电出版社
2021年7月
3、
R语言与Bioconductor生物信息学应用
高山,欧剑虹,肖凯
天津科技翻译出版有限公司
2014年1月
课程教师信息
贾俊波:国科大杭州高等研究院副研究员