生物信息学
课程编码:180085071000M1002H
英文名称:Bioinformatics
课时:60
学分:3.00
课程属性:学科核心课
主讲教师:陈润生等
教学目的要求
本课程是为研究生开设的学科核心课。随着人类基因组计划的完成和各种类型的生物大数据的出现,生物信息学迅速成为生命科学的前沿领域。生物信息学是生物学与物理学、化学、数学、信息科学及计算机科学交叉的学科。研究生物信息的采集、处理、存储、传播,分析和解释等各方面。高通量的实验技术的出现,使得生物大数据呈指数式增长,传统的方法难以处理如此海量的数据。生物信息学作为一门独立的学科,为处理日益增长的生物大数据提供了完备的解决方案。
本课程为学生讲解生物信息学的基本概念、主要研究内容和今后的主要研究方向,建立生物信息学的知识体系,为今后的学习和研究工作打下牢固基础;使学生掌握基本的生物信息学数据库,了解常用的数据分析方法和工具,熟悉高通量实验技术的基本原理和数据的分析流程。
预修课程
无
大纲内容
第一章 生物信息学现状和重要研究方向 3学时 陈润生
第1节 什么是生物信息学
第2节 生物信息学的研究内容—经典课题和例子
第二章 新基因和新SNPs的发现与鉴定 3学时 陈润生
第1节 利用 EST 数据库 (dbEST) 发现新基因和新SNPs
第2节 从基因组 DNA序列中预测新ORF
第三章 单细胞测序与空间转录组技术 3学时 陈小伟
第1节 单细胞测序
第2节 人类细胞图谱计划
第3节 空间转录组
第四章 完整基因组的比较研究 3学时 陈润生
第1节 完整基因组序列的比较研究的产生
第2节 完整基因组序列的比较研究的发展
第3节 完整基因组序列的比较研究常用方法
第五章 生物信息学进一步发展中最值得关心的问题 3学时 陈润生
第1节 系统生物学的出现与发展
第2节 非编码区功能研究
第六章 从新冠病毒、精准医学到核酸药物 3学时 陈润生
第1节 新冠爆发的启示
第2节 精准医学
第3节 核酸药物
第七章 Linux操作系统常用命令 3学时 陈小伟
第1节 Linux操作系统
第2节 Linux常用命令
第八章 高通量测序技术及数据分析 3学时 陈小伟
第1节 高通量测序技术
第2节 高通量测序数据分析
第九章 生物信息分析的基本理念 4学时 陈小伟
第1节 了解生命科学大数据分析的重要性
第2节 了解生命科学大数据涉及的主要类型
第3节 了解生命科学大数据分析过程的常见问题
第4节 了解开展正确的生命科学大数据分析的思维方法
第5节 了解生命科学大数据分析面临的挑战
第十章 基因组分析知识与技能-1 4学时 王秀杰
第1节 人类基因组研究历史上的重要事件介绍
第2节 人类基因组研究历史上做出突出贡献的科学家和相关事迹
第3节 人类基因组测序计划及其成果介绍
第4节 人类基因组的染色体组成与序列总体情况简介
第5节 人类基因组中X与Y染色体的序列和功能差异介绍
第6节 当前人类基因组序列的主要数据资源网站介绍
第十一章 基因组分析知识与技能-2 4学时 王秀杰
第1节 基因组序列组装的基本原理与方法简介
第2节 基因组组装质量的评价标准N50与L50的定义和计算方法介绍
第3节 贪心算法基本原理及其在基因组序列组装中的应用介绍
第4节 德布鲁因图的基本原理及其在基因组序列组装中的应用介绍
第5节 基因组测序方法和基因组序列组装软件介绍
第6节 常用基因组数据资源网站介绍
第7节 以盐芥基因组组装为例,介绍基因组组装的方法和流程
第十二章 基因预测算法与方法 4学时 王秀杰
第1节 基因预测的基本概念和挑战简介
第2节 基因预测的原理介绍
第3节 原核生物和真核生物的基因预测原理异同
第4节 常用的基因预测方法与软件介绍
第5节 马科夫模型和隐马科夫模型的基本概念与方法介绍
第6节 基因预测准确性评价参数¾特异性和灵敏度的定义和计算方法
第7节 基因预测方法应用的举例分析
第十三章 生物信息分析与人类遗传变异 4学时 王秀杰
第1节 人类遗传学研究涉及的基本概念介绍
第2节 队列研究的定义和队列选择原则
第3节 SNP的定义、表示方法与分类
第4节 CNV和CNV相关疾病介绍
第5节 基因组序列变异的检测方法
第6节 GWAS的原理与分析方法
第7节 人类基因组变异数据资源介绍
第8节 GTEX项目与人类基因组序列变异研究现状
第十四章 RNA二级结构预测与非编码RNA 4学时 王秀杰
第1节 非编码RNA与RNA分子的重要性简介
第2节 RNA二级结构的表示方法和相关概念
第3节 RNA二级结构的预测方法与软件
第4节 动态规划算法的基本原理及其在序列比对中的应用
第5节 miRNA、siRNA、circRNA等主要非编码RNA类型与功能介绍
第6节 人工智能及其在RNA二级结构预测中的应用
第十五章 生物信息学分析常用数据资源与软件 4学时 王秀杰
第1节 NCBI网站的主要数据资源与分析软件
第2节 BLAST的基本原理和本地安装运行BLAST的方法
第3节 UCSC、Ensembl等主要数据资源与功能
第4节 如何针对给定基因或蛋白质开展相关信息分析工作
第5节 基因芯片和高通量测序数据分析方法与软件介绍
第6节 生物信息分析主要软件资源介绍
第十六章 生物信息学发展面临的机遇与挑战 4学时 王秀杰
第1节 生物信息学发展历史上的经典研究成果介绍
第2节 生物信息分析面临的主要挑战简介
第3节 结合实例,介绍如何提升数据分析结果的创新性
第4节 结合实例,介绍如何有效利用公共数据
第5节 Linux与Bioconductor简介
第6节 生物信息学发展趋势与相关科研能力要求介绍
第十七章 考试 4学时 王秀杰
第1节 考试
参考书
1、
生物信息学
樊龙江
2023年1月
科学出版社
课程教师信息
首席教授陈润生院士是我国最早从事理论生物学、生物信息学以及非编码RNA研究的科研人员之一。三十多年来在生物信息学领域进行了系统的研究,曾参加我国第一个完整基因组泉生热袍菌B4基因组序列的组装和基因标识,曾参加人类基因组1%和水稻基因组工作草图的研究。构建了收录非编码RNA及其基因的数据库NONCODE,以及收录非编码RNA与其它生物大分子相互作用的数据库NPInter,这两个数据库也已成为了国际在非编码RNA领域非常有影响力的数据库。共发表SCI学术论文200余篇,自1996年以来在国际学术会议上共作大会报告及分组会报告二十余次。由于在基因组信息学领域的早期工作,1996年9月29日至10月3日在日本筑波召开的第十五届国际科学技术数据委员会(CODATA)大会上应邀作“Kotani Memorial Lecture”,同时获得“小谷正雄”奖(“Kotani Prize”,生物领域)。现为国际人类基因组组织(HUGO)会员;国际数据库组织(CODATA)生物大分子专业组委员;国际纯粹及应用物理学会(IUPAP)生物信息学专业委员会委员;国际学术期刊《Journal of Theoretical Biology》编委。
主讲教师王秀杰研究员是生物信息学领域杰出的青年代表,2004年获得美国洛克菲勒大学生物信息学专业博士学位。2004年底加入中国科学院遗传与发育生物学研究所,是当时中国最年轻的博士生导师,现任中科院遗传发育所研究员、分子系统生物学研究中心主任与党支部书记。2007年获国家杰出青年科学基金,2016年入选中组部“万人计划领军人才”。中国共产党十九大和二十大代表。兼任第十二届中华全国青年联合会科学技术界别工作委员会副主任委员、RNABiology杂志编委等职务。王秀杰研究员主要从事非编码RNA的系统发现和功能相关的生物信息学与实验生物学研究工作,代表性工作包括发现心衰相关的miRNA,发现miRNA在调控m6A甲基化修饰方面的全新功能,发现m6A修饰促进长时记忆的形成等。发表SCI论文100余篇,他引5000余次,多项工作得到了ScienceNow, Nature Review Genetics, Faculty of 1000 Biology等科技媒体的推荐与好评。