课程大纲

课程大纲

自然语言处理

课程编码:085400M05009T 英文名称:Natural Language Processing 课时:32 学分:2.00 课程属性:专业普及课 主讲教师:李太豪等

教学目的要求
自然语言处理是智能科学与技术学院的一门专业选修课。它的主要任务是使学生了解自然语言处理的主要研究内容及关键技术,并介绍自然语言处理方面的研究成果,为学生从事自然语言处理研究和开发做准备。此外,通过指导学生阅读计算语言学专业会议的论文,并通过提问和讨论,使他们对所学课程的有关概念与目前的流行方法和技术的关系有更深入地了解。在此基础上,要求学生完成一篇有关自然语言处理主题的课程项目,使他们能用所学的知识发挥自身的能力查找有关资料和概括某一研究领域的国内外最新理论和技术并最终加以实践。

预修课程
线性代数、微积分、概率论、python基础

大纲内容
第一章 自然语言处理概述 2学时
第1节 自然语言处理的现状与前景
第2节 自然语言处理应用与经典任务
第二章 文本预处理 2学时
第1节 预处理:分词、词的标准化、去停用词等
第2节 词表示:独热表示与分布式表示、词向量技术
第三章 循环神经网络与语言模型 6学时
第1节 循环神经网络介绍:RNN,LSTM,GRU
第2节 语言模型
第四章 文本挖掘 4学时
第1节 文本分类
第2节 文本聚类;自动文摘
第五章 文本检索 4学时
第1节 全文检索
第2节 搜索引擎
第六章 知识图谱与问答 4学时
第1节 知识图谱定义及文本知识抽取
第2节 基于知识图谱的知识推理与问答
第七章 口语交互与对话系统 3学时
第1节 任务导向对话系统
第2节 闲聊对话机器人
第八章 预训练模型 4学时
第1节 NLP预训练模型发展现状
第九章 专题研讨课 3学时
第1节 课程项目专题研讨

参考书
1、 统计自然语言处理、神经网络与深度学习、Speech and Language Processing 宗成庆、邱锡鹏、Dan Jurafsky 2013年08月;2021年05月;2020年12月 机械工业出版社;清华大学出版社;(无,网络电子档)

课程教师信息
李太豪,之江实验室人工智能研究院前沿理论研究中心中心负责人、研究专家,主要研究方向为自然语言处理与情感计算;王永恒,之江实验室研究专家,曾任湖南大学副教授,主要研究方向为大数据分析、机器学习与智能决策;