课程大纲

课程大纲

自然语言处理

课程编码:280216085404P2009 英文名称:Natural Language Processing 课时:60 学分:3.00 课程属性:专业核心课 主讲教师:齐洪钢等

教学目的要求
本课程为计算机学科研究生的专业核心课。本课程讲授和讨论自然语言处理前沿研究领域的主要思想和关键技术。主要内容包括基础机器学习模型、隐马尔可夫模型、语言模型、神经网络、强化学习、词法分析、句法分析、生成式模型、大规模语言模型以及 chatGPT 等。通过本课程的学习,希望学生能了解自然语言处理前沿研究领域,了解人类语言技术的最新研究成果,掌握基本思想和关键技术,培养学生自然语言处理相关技术的研究能力。

预修课程
概率论与数理统计、算法分析与程序设计、Python 编程。

大纲内容
第一章 第一章 课程概述及相关基础 6学时 齐洪钢
第1节 第一节 课程介绍
第2节 第二节 自然语言处理概述
第3节 第三节 数学基础
第二章 第二章 自然语言处理中的机器学习 19学时 王博
第1节 第一节 隐马尔可夫模型
第2节 第二节 线性模型
第3节 第三节 对数线性模型
第4节 第四节 神经网络
第5节 第五节 图模型
第6节 第六节 强化学习
第三章 第三章 自然语言处理基础技术 11学时 王博
第1节 第一节 分类与聚类
第2节 第二节 语言模型
第3节 第三节 词法分析
第4节 第四节 句法分析
第5节 第五节 语义分析
第四章 第四章 自然语言处理应用 11学时 齐洪钢
第1节 第一节 机器翻译
第2节 第二节 对话系统
第3节 第三节 文本摘要
第4节 第四节 问答系统
第5节 第五节 信息抽取
第五章 第五章 自然语言处理前沿技术 13学时 齐洪钢
第1节 第一节 大规模语言模型
第2节 第二节 ChatGPT与GPT-4
第3节 第三节 大语言模型分析与实践
第4节 第四节 前沿动态

参考书

课程教师信息
齐洪钢,中国科学院大学,计算机科学与技术学院教授,国际标准组织ISO/IEC JTC 1/ SC 29委员、中国计算机学会多媒体技术专委会执行委员、中国人工智能学会深度学习专委会执行委员、自动化学会无人系统专委会委员、《中国图象图形学报》编委,数字多媒体芯片技术国家重点实验室特聘研究员,博士毕业于中国科学院计算技术研究所,先后获得浙江省高校科研成果三等奖、杭州市自然科学学术成果一等奖、(ICIP2014) 授予的前10%优秀论文奖 (Top 10% Award)、国际MPII人体姿态估计竞赛第一名。2008年开始从事研究生教学,先后主讲《视频编码及传输》、《人机接口》等课程。
王博,天津大学,计算机科学与技术学院教授,中国中文信息学会委员,中国人工智能协会社会计算与智能专委会委员。博士毕业于哈尔滨工业大学,长期从事自然语言处理与大模型和智能体方向的研究工作,获天津市科技进步一等奖,主持多项自然语言处理领域国家自然科学基金项目,国家重点研发计划子课题。长期主讲《离散数学》、《自然语言处理》和《社会计算导论》课程,其中《社会计算导论》也作为国科大夏季学期的强化课程,讲授10余年。