自然语言处理
课程编码:180086085404P2009H
英文名称:Natural Language Processing
课时:60
学分:3.00
课程属性:专业核心课
主讲教师:冯洋等
教学目的要求
本课程为计算机学科研究生的专业核心课。本课程讲授和讨论自然语言处理前沿研究领域的主要思想和关键技术。主要内容包括基础机器学习模型、隐马尔可夫模型、语言模型、神经网络、强化学习、词法分析、句法分析、生成式模型、大规模语言模型以及 chatGPT 等。通过本课程的学习,希望学生能了解自然语言处理前沿研究领域,了解人类语言技术的最新研究成果,掌握基本思想和关键技术,培养学生自然语言处理相关技术的研究能力。
预修课程
概率论与数理统计、算法分析与程序设计、Python 编程。
大纲内容
第一章 第一章 课程概述及相关基础 6学时 冯洋
第1节 第一节 课程介绍
第2节 第二节 自然语言处理概述
第3节 第三节 数学基础
第二章 第二章 自然语言处理中的机器学习 19学时 冯洋
第1节 第一节 隐马尔可夫模型
第2节 第二节 线性模型
第3节 第三节 对数线性模型
第4节 第四节 神经网络
第5节 第五节 图模型
第6节 第六节 强化学习
第三章 第三章 自然语言处理基础技术
第1节 第一节 分类与聚类 1学时 冯洋
第2节 第二节 语言模型 2学时 冯洋
第3节 第三节 词法分析 2学时 冯洋
第4节 第四节 句法分析 3学时 王石
第5节 第五节 语义分析 3学时 王石
第四章 第四章 自然语言处理应用
第1节 第一节 机器翻译 1学时 冯洋
第2节 第二节 对话系统 3学时 王石
第3节 第三节 文本摘要 1学时 冯洋
第4节 第四节 问答系统 3学时 王石
第5节 第五节 信息抽取 3学时 王石
第五章 第五章 自然语言处理前沿技术 13学时 冯洋
第1节 第一节 大规模语言模型
第2节 第二节 ChatGPT与GPT-4
第3节 第三节 大语言模型分析与实践
第4节 第四节 前沿动态
参考书
课程教师信息
冯洋,中科院计算技术研究所研究员、博士生导师、自然语言处理团队负责人、中国人工智能学会首批杰出会员,主要研究方向为自然语言处理、机器翻译和人机对话。在自然语言处理领域顶级会议ACL发表长文20多篇,担任中国中文信息学会青年工作委员会副主任、ACL Rolling Review Permanent Senior Action Editor以及ACL/EMNLP会议高级领域主席/领域主席等。机器翻译方面的工作获得ACL 2019唯一最佳长文奖,为ACL开办50多年来中国单位首次获得该奖项,并获CCF自然语言处理专委会 “青年新锐奖”、 “钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等,主持自然科学基金面上项目、国家重点研发计划重点专项等项目。
王石,男,博士,高级工程师、硕导。2009年毕业于中国科学院计算技术研究所并获工学博士学位,主要从事神经-符号计算、自然语言处理、大语言模型、辅助决策等领域的研究和应用,先后承担国家重点研发计划、国家信息安全计划、国家重大工程专项、北京市科技新星交叉课题等项目10余项,发表于AAAI、WWW、ACL等中国计算机协会(CCF)推荐的A/B类国际顶级会议10余篇,授权专利6项。