课程大纲

课程大纲

生物信息大数据挖掘分析和实践

课程编码:1802040710X1P3002H 英文名称:Bioinformatics Big Data: Analysis, Mining and Practice 课时:40 学分:2.00 课程属性:专业课 主讲教师:鲍一明等

教学目的要求
生物信息学是一门以研究生命科学问题为目标,涉及计算机编程、算法设计、数理统计、机器学习等学科的交叉学科。随着近年来高通量测序技术的发展和组学大数据的积累,优秀的生物信息学数据库不断涌现,生物信息学得到了突飞猛进的发展,也迎来了更多的机遇。本课程从介绍主流生物信息学数据库和生物信息学研究的基本技术开始,结合目前生物信息学领域的前沿和热点应用,讲授生物信息学的相关问题和数据挖掘分析方法,为学生今后的相关研究工作打下基础。

预修课程

大纲内容
第一章 国内外主要生物信息数据资源介绍及实践 20学时 鲍一明
第1节 国内外主要生物信息数据中心介绍
第2节 NCBI资源介绍
第3节 NCBI 常用工具的使用和实践
第4节 病毒数据库和数据分析应用
第5节 数据库设计理念及实践
第6节 国家生物信息中心数据资源实践
第二章 生物信息数据分析实践 20学时 赵文明
第1节 生物信息基本工具与方法
第2节 生物大数据与云计算
第3节 生物信息基础技能实践
第4节 生物信息数据分析实践
第5节 生物信息数据库建设技术(数据库技术、GSA、数据整合等)

教材信息
1、 生物信息学(第四版) 陈铭 2022年3月 科学出版社

参考书

课程教师信息
鲍一明研究员于1987年获得北京大学生物化学专业学士学位,1987-1990 年任北京大学生物系助教,1994年于英国John Innes中心获遗传学博士学位,1994-2001年任美国Noble 基金会高级研究助理,2001-2005 年任美国ComputerCraft 病毒基因组科学家,2005-2017 年任美国国家生物信息中心(NCBI)研究科学家,2017 年鲍一明博士任中科院北京基因组研究所生命与健康大数据中心(BIGD)主任,全面负责中心的科研及运行管理。鲍一明博士在NCBI工作期间组织建立了流感病毒数据库,该数据库是该领域世界范围内数据最准确、用户最多的公共开放数据库。日最高IP 地址登陆近2万个,点击量超过22万次,是NCBI主页上除人和小鼠以外唯一特别推荐的物种数据库。该库先后于2002年和2006年被《科学》杂志“NetWatch”选取报道,相关网页于2005年被收录到Current Contents Connect 中,2009年在美国ABC 电视台“地球末日”节目予以报道。流感病毒数据库已被美国多所知名大学生物信息专业选为经典教案讲授。领导开发了基于全基因组序列比较的病毒分类系统PASC,该系统已成为病毒分类方法中最为广泛使用的软件系统。鉴于其在流感病毒数据库开发中的突出贡献,鲍一明博士于2006 年获得NIH成就奖(Merit Award)。