大数据分析与挖掘
课程编码:180206085410M3003Y
英文名称:Big Data Analysis and Mining
课时:40
学分:2.00
课程属性:专业课
主讲教师:唐海娜
教学目的要求
随着信息技术的不断发展和广泛应用,各行各业的数据都在爆发式地产生,并以指数级的速度快速增长着。大数据为不同领域的创新和发展带来巨大价值,大数据技术也成为当前学术界和产业界关注的热点。
本门课程首先阐述大数据的概念和特点,刨析在电子商务、智慧交通、社交网络、生物医学等不同领域数据洪流带来的技术挑战,在此基础上结合链接分析、频繁项集挖掘、推荐系统、图神经网络等讲授大数据分析与挖掘中的经典算法和前沿技术进展。通过本门课程的学习,要求学生了解大数据的产生背景、应用需求及技术体系;掌握大数据分析与挖掘的基础理论和关键算法;熟悉大数据在不同行业中的经典案例。
预修课程
无
大纲内容
第一章 大数据概述 4.0学时 唐海娜
第1节 什么是大数据
第2节 大数据技术体系
第3节 大数据的价值和应用
第二章 大数据技术基础 4.0学时 唐海娜
第1节 聚类技术
第2节 分类技术
第三章 链接分析 8.0学时 唐海娜
第1节 Google的案例
第2节 Pagerank算法及其计算问题
第3节 面向主题的PageRank
第4节 Pagerank算法的应用
第四章 文本大数据 4.0学时 唐海娜
第1节 文本表示方法
第2节 文本检索技术
第3节 文本大数据的应用
第五章 频繁项集挖掘 4.0学时 唐海娜
第1节 购物篮模型
第2节 A-priori算法
第3节 大数据集在内存中的处理
第六章 图数据挖掘 6.0学时 唐海娜
第1节 图上的计算任务
第2节 浅层网络嵌入
第3节 图神经网络及应用
第七章 数据流分析 2.0学时 唐海娜
第1节 数据流的计数及过滤
第2节 Heavy Hitter检测
第八章 推荐系统 4.0学时 唐海娜
第1节 推荐系统概述
第2节 基于内容的推荐
第3节 基于协同过滤的推荐
第九章 课程总结 4.0学时 唐海娜
第1节 课程总结
第2节 考试
参考书
课程教师信息
唐海娜,人工智能学院副教授,主要研究方向包括时空数据挖掘、网络异常检测等。