课程大纲

课程大纲

大数据技术概论

课程编码:085400M02008Y 英文名称:Introduction to Big Data Technology 课时:40 学分:2.00 课程属性:一级学科普及课 主讲教师:唐海娜

教学目的要求
随着信息技术的广泛应用和不断发展,产生了海量的数据,并以指数级的速度快速增长着。大数据为不同领域的创新和发展带来巨大价值,大数据技术也成为当前学术界和产业界关注的热点。本门课程首先阐述大数据的来源、概念和特点,刨析数据洪流带来的机遇和挑战,在此基础上讲授大数据挖掘计算中的经典算法和前沿技术。通过本门课程的学习,同学们可以掌握大数据技术的基础知识、核心理论和关键算法,熟悉大数据的思维方法,并了解大数据技术在不同行业中的典型应用。

预修课程

大纲内容
第一章 大数据概述 4学时
第1节 什么是大数据
第2节 大数据技术体系
第3节 大数据的价值和应用
第二章 链接分析 8学时
第1节 Google的案例
第2节 Pagerank算法
第3节 Pagerank的计算问题
第4节 面向主题的PageRank
第5节 Hadoop MapReduce
第三章 聚类及分类 4学时
第1节 聚类技术
第2节 分类技术
第四章 文本大数据 4学时
第1节 文本表示方法
第2节 文本检索技术
第3节 文本大数据的应用分析
第五章 频繁项集 4学时
第1节 购物篮模型
第2节 A-priori算法
第3节 大数据集在内存中的处理
第六章 图表示学习 6学时
第1节 图上的计算任务
第2节 浅层网络嵌入
第3节 图神经网络
第4节 图数据的应用分析
第七章 数据流分析 2学时
第1节 数据流的计数及过滤
第2节 Heavy Hitter检测
第八章 推荐系统 4学时
第1节 推荐系统概述
第2节 基于内容的推荐
第3节 协同过滤
第4节 基于图的推荐
第九章 课程总结 4.0学时
第1节 课程总结
第2节 考试

参考书
1、 大数据:互联网大规模数据挖掘与分布式处理(第二版) Anand Rajaraman 2015年7月 人民邮电出版社

课程教师信息
唐海娜,人工智能学院副教授,主要研究方向包括时空数据挖掘、社交网络分析以及网络异常检测等。