课程大纲

课程大纲

自然语言处理

课程编码:180086085404P2009H 英文名称:Natural Language Processing 课时:60 学分:3.00 课程属性:专业核心课 主讲教师:黄河燕等

教学目的要求
本课程为计算机学科研究生的专业核心课。本课程讲授和讨论自然语言处理前沿研究领域的主要思想和关键技术。主要内容包括基础机器学习模型、隐马尔可夫模型、语言模型、神经网络、强化学习、词法分析、句法分析、生成式模型、大规模语言模型以及 chatGPT 等。通过本课程的学习,希望学生能了解自然语言处理前沿研究领域,了解人类语言技术的最新研究成果,掌握基本思想和关键技术,培养学生自然语言处理相关技术的研究能力。

预修课程
概率论与数理统计、算法分析与程序设计、Python 编程。

大纲内容
第一章 第一章 课程概述及相关基础 6学时 张仰森
第1节 第一节 课程介绍
第2节 第二节 自然语言处理概述
第3节 第三节 数学基础
第二章 第二章 自然语言处理中的机器学习
第1节 第一节 隐马尔可夫模型 3学时 张仰森
第2节 第二节 线性模型 3学时 张仰森
第3节 第三节 对数线性模型 3学时 张仰森
第4节 第四节 神经网络 3学时 张仰森
第5节 第五节 图模型 3学时 张仰森
第6节 第六节 强化学习 4学时 胡玥
第三章 第三章 自然语言处理基础技术 11学时 胡玥
第1节 第一节 分类与聚类
第2节 第二节 语言模型
第3节 第三节 词法分析
第4节 第四节 句法分析
第5节 第五节 语义分析
第四章 第四章 自然语言处理应用 11学时 黄河燕
第1节 第一节 机器翻译
第2节 第二节 对话系统
第3节 第三节 文本摘要
第4节 第四节 问答系统
第5节 第五节 信息抽取
第五章 第五章 自然语言处理前沿技术
第1节 第一节 大规模语言模型 3学时 黄河燕
第2节 第二节 ChatGPT与GPT-4 3学时 黄河燕
第3节 第三节 大语言模型分析与实践 3学时 黄河燕
第4节 第四节 前沿动态 4学时 胡玥

参考书

课程教师信息
黄河燕,博士,北京理工大学特聘教授,北京市海量语言信息处理与云计算应用工程技术研究中心和工信部信息智能处理与内容安全重点实验室主任。长期从事人工智能与计算机科学的教学和研究工作。现兼任教育部基础学科拔尖学生培养计划2.0专家委员会委员,教育部计算机专业教指委副主任委员、教育部信息技术新工科产学研联盟常务副理事长,现为中国人工智能学会和中国中文信息学会会士。坚持教学一线,承担多门本科生、硕/博士研究生必修课等课程教学工作,包括《计算机新技术专题》、《人工智能导论》、《自然语言处理》、《大模型算法与实践》等。2018年牵头申报获批教育部人工智能本科专业,并担任专业责任教授;牵头申请获批教育部首批基础学科拔尖学生培养计划2.0基地;主持完成教育部国家级新工科研究与实践人工智能领域项目2项,教育部产学研协同育人教改项目多项;牵头申报获批了教育部-华为智能基座“自然语言处理课程群虚拟教研室”。
近几年来,作为项目负责人获批国家重点研发计划项目1项、国家自然科学基金应急管理项目1项、国家自然科学基金联合基金重点项目2项、工信部工业互联网创新发展工程项目1项、北京市科技计划项目1项、教育部-中国移动科研基金项目1项、国防科技项目管理中心项目1项;作为课题负责人获批国家重点研发计划课题1项、国家自然科学基金重点项目1项、工信部工业互联网创新发展工程项目1项、工信部高质量发展项目2项;技术合作项目10项。发表高水平学术论文100余篇,获授权发明专利20余项,以第一完成人获中国电子学会科学技术一等奖(基于海量知识的智能理解与推理关键技术及智能政务应用,2018.12)和国防科学技术进步二等奖(异构大数据智能处理关键技术及应用,2021.12)。

胡玥,博士,中国科学院信息工程研究所研究员/博士生导师,第二届信工所学位委员会委员,中国科学院大学网络空间安全学院岗位教授/博士生导师,国科大网络空间安全学院本科教育指导小组副组长,主要从事人工智能和自然语言处理方面的研究工作,包括机器翻译、 智能对话、机器阅读理解等。 在ACL,AAAI 、EMNLP、COLING、 ICLR等国际/国内会议及期刊发表论文100余篇,曾获“第四届中国科协期刊优秀学术论文”奖, 2022 ACL杰出论文奖,出版专著2部,获发明专利6项。主持和参加科技部重点研发项目,网络空间安全重点专项,国家863课题,973子课题,自然科学基金项目等20余项。曾担任科技部重点专项,国家自然科学基金和北京市自然科学基金等多种项目评审专家。
在中国科学院大学开设硕士研究生核心课程《自然语言处理基础》和本科生必修课程《计算机组成原理》,在信工所开设博士生课程《基于深度学习的自然语言处理》,各门课程每次教学评估均为优秀,深受学生欢迎。其中,《自然语言处理基础》课程被评为中国科学院大学校级优秀课程,《计算机组成原理》被评为国科大网络空间安全学院优秀课程。
荣获中科院朱李月华优秀教师奖和多次国科大教学优秀奖,具有丰富的学生指导经验,所指导学生成绩优异,其中一人获ACL 2022 杰出论文奖,一人获华为天才少年荣誉称号,多人荣获所级优秀学术干部,科学院院长奖,国家奖学金,北京市优秀毕业生等荣誉称号。

张仰森,北京信息科技大学二级教授、博士生导师,享受国务院政府特殊津贴,校级教学名师,网络空间安全学科负责人,北京市科技创新团队带头人。曾任计算机学院副院长和信息管理学院院长,现任智能信息处理研究所所长。CCF杰出会员,中国中文信息学会理事,CAAI智能信息网络专委会副主任,北京审计学会电子数据审计专委会主任。北京交通大学、北京邮电大学、燕山大学兼职教授。
长期从事计算机科学技术与人工智能的教学与研究工作,主讲“数据结构”、“数据仓库与数据挖掘”、“计算机导论”“人工智能前沿技术讲座”等本科课程和“人工智能原理与应用”、“自然语言处理”研究生课程。研究方向包括自然语言处理、人工智能、网络内容安全。主持国家自科基金项目5项、国家242信息安全计划项目6项、国家社科重大项目课题1项、国家重点研发子课题2项,北京市自科和社科基金重点项目各1项以及其他纵横向科研课题50余项。在国内外重要期刊和学术会议发表论文250余篇,获授权发明专利18项,出版学术专著和教材15部。获北京市科技进步二等奖3项(2项第1),教育部科技进步二等奖1项(第1),钱伟长中文信息处理科学技术奖一等奖1项(第1),北京市高等教育教学成果二等奖1项(第1),北京市精品教材和优质本科教材课件奖各1项(第1),山西省科技进步一等奖1项(第8)。