数据科学R与Python实践
课程编码:180087120500MX007H
英文名称:Practical Data Science with R and Python
课时:40
学分:1.00
课程属性:公共选修课
主讲教师:顾立平
教学目的要求
本课程是为培养下一代数据科学家进行的信息素质教育课程,课程旨在通过案例以及R与Python的上机操作,辅之讲解必要的知识理论,予以培养。
随着大数据国家战略出台,中央要求各级领导干部多一个基本功:增强利用数据推进各项工作的本领。2017年12月10日,习近平总书记在中央政治局第二次集体学习时的重要讲话指出:“...现在,世界各国都把推进经济数字化作为实现创新发展的重要动能,在技术研发、数据共享、安全保护等方面进行前瞻性布局。...善于获取数据、分析数据、运用数据,是领导干部做好工作的基本功。懂得大数据,用好大数据,增强利用数据推进各项工作的本领,已经成为领导干部的新时代必修课。...”
选课同学应该勤做练习,要求能够吃透上课所发的代码,能够独立完成每章之后留下的作业,最终能够:以科学精神和科学方法为准则,以R和Python为手段,面向所属的专业学科的问题,进行数据科学的研究工作。所以,课程根据“从做中学”的方式进行授课。课程秉持“不谈颠覆、不侃概念、只做实践”的原则,环绕六项指示精神“技术研发、数据共享、安全保护、获取数据、分析数据、运用数据”等进行设计,选课上课同学可以把具体科研课题与授课老师进行交流,将会取得更好的学习成效。
科学数据已成为科技发展的“头等公民”(Research Data as First-Class citizen)。当前,数据科学家、数据公民、数据管理员正在成为创新社会的新兴动力。目前环绕数据科学、数据政策、数据管理的课题日益重要,不仅社会各界都已面临实际发展战略上的这个核心问题,而且也将直接影响个人职业生涯的生存与未来发展。
预修课程
无
大纲内容
第一章 概论 3.0学时 顾立平
第1节 数据科学以及国际国内的最新进展
第2节 Python的安装和基本练习
第3节 R的安装和基本练习
第二章 计算算法简介 3.0学时 顾立平
第1节 排序
第2节 递归
第3节 广度优先搜索
第三章 微积分简介(上) 3.0学时 顾立平
第1节 不定积分
第2节 定积分
第3节 微分方程
第四章 微积分简介(下) 3.0学时 顾立平
第1节 多元函数微分法
第2节 重积分
第3节 无穷级数
第五章 运筹学简介 3.0学时 顾立平
第1节 线性规划
第2节 动态规划
第3节 图与网络
第六章 统计检验 3.0学时 顾立平
第1节 抽样分布
第2节 假设检验
第3节 回归预测
第七章 统计学习 3.0学时 顾立平
第1节 机械学习
第2节 有监督学习
第3节 无监督学习
第八章 数据分析 3.0学时 顾立平
第1节 描述统计
第2节 生存分析
第3节 元分析
第九章 试验分析 3.0学时 顾立平
第1节 方差分析
第2节 析因设计
第3节 正交设计
第十章 推断模型 3.0学时 顾立平
第1节 概率推理
第2节 贝叶斯模型
第3节 概率混合模型
第十一章 数据库简介 3.0学时 顾立平
第1节 数据库搭建
第2节 数据库语句
第3节 大数据架构
第十二章 优化论简介 3.0学时 顾立平
第1节 线性代数
第2节 概率
第3节 优化
第十三章 人工智能简介 3.0学时 顾立平
第1节 卷积神经网络
第2节 深度学习技术
第3节 自然语言处理
第十四章 博弈论 1.0学时 顾立平
第1节 博弈论
参考书
1、
数据馆员的Hadoop简明手册
顾立平, 袁慧
2017年10月
科学技术文献出版社
2、
数据馆员的Spark简明手册
顾立平, 马景源
2017年
科学技术文献出版社
3、
科学数据开放获取的政策研究
顾立平
2016年2月
科学技术文献出版社
课程教师信息
中国科学院文献情报中心,研究馆员