课程大纲

课程大纲

科技情报数据分析方法与技术

课程编码:120500M01003H 英文名称:Analysis of Scientific and Technological Information 课时:50 学分:3.00 课程属性:一级学科核心课 主讲教师:乐小虬等

教学目的要求
本课程为情报学与图书馆学硕士研究生专业核心课。教学目的:1)使情报学专业研究生系统性掌握情报研究中数据分析的基本流程、理论体系及主要技术实现方法; 2)从应用案例出发,重点阐述情报分析过程中的数据采集、数据清洗、计量分析、数据分析模型、文献内容挖掘、技术挖掘、数据可视化等技术方法;3)采用理论与实践相结合的方法,旨在提高学生的动手能力,注重实用,为情报学专业研究生从事专业方向研究提供核心技能。

预修课程
数理统计

大纲内容
第一章 绪论
第1节 主要研究内容及范畴 0.5学时
第2节 主要理论体系 0.5学时
第3节 主要技术体系 1学时
第4节 趋势与挑战 1学时
第二章 科技情报数据来源与获取
第1节 情报分析数据资源体系 1学时
第2节 数据获取方式方法 1学时
第3节 网络数据采集技术 1学时
第三章 数据组织与融汇
第1节 数据描述规范 1学时
第2节 数据清洗/转换 2学时
第3节 数据汇聚/融合 2学时
第4节 知识图谱关联 2学时
第5节 数据采集及预处理实验讨论 2学时
第四章 文献知识网络
第1节 文献知识网络概述 0.5学时
第2节 文献知识网络构建方法 0.5学时
第3节 网络分析技术 1学时
第4节 应用案例 1学时
第五章 机器学习模型
第1节 机器学习概述 1学时
第2节 典型统计学习模型(逻辑回归模型/CRF/SVM) 1学时
第3节 深度学习模型(CNN/RNN/Transformer/迁移学习) 2学时
第4节 应用案例实验与讨论 2学时
第六章 文本分析技术
第1节 文本表示方法 1学时
第2节 文本分类/聚类 2学时
第3节 主题识别 (LDA模型) 2学时
第4节 命名实体/关系抽取 2学时
第5节 案例实验与讨论 2学时
第七章 创新分析技术
第1节 Triz创新理论 1学时
第2节 新颖性分析 1学时
第3节 颠覆性识别 1学时
第八章 大数据计算平台
第1节 科技情报大数据技术整体架构 1学时
第2节 分布式技术选型 1学时
第3节 分布式存储平台/分布式计算平台/分布式检索平台 2学时
第4节 基于微服务架构的大数据服务平台 2学时
第九章 数据可视化技术
第1节 数据可视化概述 2学时
第2节 数据可视化模型 2学时
第3节 数据可视化开源工具 2学时
第十章 科技情报数据分析典型应用
第1节 情报分析工具 1学时
第2节 科技前沿分析案例 1学时
第3节 专题情报分析案例 1学时

参考书
1、 统计学习方法 李航 2012年 清华大学出版社

课程教师信息
博士,中国科学院国家科学图书馆总馆信息系统部副研究馆员。2006年毕业于中国科学院遥感应用研究所获博士学位。2009年在Emory大学图书馆作访问学者。主要研究领域涉及信息检索、知识技术、数字图书馆技术、嵌入式服务技术、GIS等方面。作为主要成员参与过“空间信息智能搜索引擎研究(863计划项目)”、“互联网敏感信息监控”等项目的系统设计和开发;隐形搜索器“词虎”的原型开发者之一;嵌入式桌面信息工具“e划通”核心开发者。发表论文10余篇。目前作为项目负责人主持的项目有:“嵌入式泛在个人研究平台”、“网络科技信息中爆发主题的监测与分析方法研究”、“e划通2.0系统建设”。

收起全文