大数据分析与挖掘
课程编码:180206085410M3003Y
英文名称:Big Data Analysis and Mining
课时:40
学分:2.00
课程属性:专业课
主讲教师:唐海娜
教学目的要求
随着信息技术的不断发展和广泛应用,各行各业的数据都在爆发式地产生,并以指数级的速度快速增长着。大数据为不同领域的创新和发展带来巨大价值,大数据技术也成为当前学术界和产业界关注的热点。
本门课程首先阐述大数据的概念和特点,刨析在电子商务、智慧交通、社交网络、生物医学等不同领域数据洪流带来的技术挑战,在此基础上结合链接分析、频繁项集挖掘、推荐系统、图神经网络等讲授大数据分析与挖掘中的经典算法和前沿技术进展。通过本门课程的学习,要求学生了解大数据的产生背景、应用需求及技术体系;掌握大数据分析与挖掘的基础理论和关键算法;熟悉大数据在不同行业中的经典案例。
预修课程
无
大纲内容
第一章 大数据概述 4.0学时 唐海娜
第1节 什么是大数据
第2节 大数据技术体系
第3节 大数据的价值和应用
第二章 大数据计算引擎 8.0学时 唐海娜
第1节 Hadoop体系架构
第2节 Hadoop Mapreduce模型
第3节 Spark内存计算模型
第4节 Spark RDD设计与应用
第三章 链接分析 8.0学时 唐海娜
第1节 Google的案例
第2节 Pagerank算法及其计算问题
第3节 面向主题的PageRank
第4节 Pagerank算法的应用
第四章 文本数据挖掘 4.0学时 唐海娜
第1节 相似文档检索
第2节 局部敏感哈希LSH
第3节 LSH函数族及其应用
第五章 频繁项集挖掘 4.0学时 唐海娜
第1节 购物篮模型
第2节 A-priori算法及优化
第六章 数据流分析 4.0学时 唐海娜
第1节 数据流的计数及过滤
第2节 Heavy Hitter检测
第七章 推荐系统 4.0学时 唐海娜
第1节 推荐系统概述
第2节 基于内容的推荐
第3节 基于协同过滤的推荐
第八章 课程总结 4.0学时 唐海娜
第1节 课程总结
第2节 考试
参考书
课程教师信息
唐海娜,人工智能学院副教授,主要研究方向包括时空数据挖掘、网络异常检测等。