课程大纲

课程大纲

自然语言处理

课程编码:180086085404P2009Y 英文名称:Natural Language Processing 课时:60 学分:3.00 课程属性:专业核心课 主讲教师:王石

教学目的要求
本课程为计算机学科研究生的专业核心课。本课程讲授和讨论自然语言处理前沿研究领域的主要思想和关键技术。主要内容包括基础机器学习模型、隐马尔可夫模型、语言模型、神经网络、强化学习、词法分析、句法分析、生成式模型、大规模语言模型以及 chatGPT 等。通过本课程的学习,希望学生能了解自然语言处理前沿研究领域,了解人类语言技术的最新研究成果,掌握基本思想和关键技术,培养学生自然语言处理相关技术的研究能力。

预修课程
概率论与数理统计、算法分析与程序设计、Python 编程。

大纲内容
第一章 第一章 课程概述及相关基础 6.0学时 王石
第1节 第一节 课程介绍
第2节 第二节 自然语言处理概述
第3节 第三节 数学基础
第二章 第二章 自然语言处理中的机器学习 19.0学时 王石
第1节 第一节 隐马尔可夫模型
第2节 第二节 线性模型
第3节 第三节 对数线性模型
第4节 第四节 神经网络
第5节 第五节 图模型
第6节 第六节 强化学习
第三章 第三章 自然语言处理基础技术 11.0学时 王石
第1节 第一节 分类与聚类
第2节 第二节 语言模型
第3节 第三节 词法分析
第4节 第四节 句法分析
第5节 第五节 语义分析
第四章 第四章 自然语言处理应用 11.0学时 王石
第1节 第一节 机器翻译
第2节 第二节 对话系统
第3节 第三节 文本摘要
第4节 第四节 问答系统
第5节 第五节 信息抽取
第五章 第五章 自然语言处理前沿技术 13.0学时 王石
第1节 第一节 大规模语言模型
第2节 第二节 ChatGPT与GPT-4
第3节 第三节 大语言模型分析与实践
第4节 第四节 前沿动态

参考书

课程教师信息
王石,博士,正高级工程师,硕士生导师。其研究方向聚焦于自然语言处理、知识图谱、认知计算等领域,先后主持国家重点研发计划课题、国防专项、国家信息安全计划、北京市科技新星计划等项目20余项,发表ACL、EMNLP、AAAI等人工智能、知识工程等领域高水平论文50余篇,参与编写国家标准1项,任人工智能学会心智计算专委会副秘书长、中国指挥与控制学会大模型与决策智能专委会常务委员等职务,获2022年度中国通讯学会科技进步一等奖。