自然语言处理
课程编码:180086081203P2002H
英文名称:Natural Language Processing
课时:60
学分:3.00
课程属性:专业核心课
主讲教师:胡玥等
教学目的要求
本课程是计算机学科研究生的专业核心课。本课程讲授和讨论自然语言处理前沿研究领域的主要思想和关键技术。主要内容包括语料库与语言知识库、词法分析、句法分析、概率语法、语义分析和机器翻译、文本分类、信息抽取与问答系统等。
通过本课程的学习,希望学生能了解自然语言处理前沿研究领域,了解人类语言技术的最新研究成果,掌握基本思想和关键技术,培养学生自然语言处理相关技术的研究能力。
预修课程
概率论与数理统计、算法分析与程序设计、Python 编程。
大纲内容
第一章 第一章 课程概述及相关基础 7学时
第1节 第1节 课程信息 1学时 胡玥
第2节 第2节 自然语言处理概述 3学时 胡玥
第3节 第3节 数学基础 3学时 胡玥
第二章 第二章 自然语言处理中的机器学习 12学时
第1节 第1节 隐马尔科夫模型 3学时 胡玥
第2节 第2节 支持向量机 3学时 胡玥
第3节 第3节 对数线性模型 3学时 胡玥
第4节 第4节 神经网络 3学时 胡玥
第三章 第三章 自然语言基础分析技术 18学时
第1节 第1节 文本分类与聚类 3学时 胡玥
第2节 第2节 语言模型 3学时 胡玥
第3节 第3节 词法分析 3学时 胡玥
第4节 第4节 句法分析 3学时 陈钰枫
第5节 第5节 语义分析 3学时 陈钰枫
第6节 第6节 篇章分析 3学时 陈钰枫
第四章 第四章 自然语言处理应用 23学时
第1节 第1节 机器翻译 3学时 陈钰枫
第2节 第2节 文本生成 3学时 陈钰枫
第3节 第3节 情感分析 3学时 陈钰枫
第4节 第4节 信息抽取 3学时 陈钰枫
第5节 第5节 知识图谱 3学时 陈钰枫
第6节 第6节 问答系统 3学时 陈钰枫
第7节 第7节 对话系统 3学时 陈钰枫
第8节 第8节 自然语言处理前沿动态 2学时 胡玥
参考书
课程教师信息
胡玥,博士,中国科学院信息工程研究所研究员/博士生导师,第二届信工所学位委员会委员,中国科学院大学网络空间安全学院岗位教授/博士生导师,国科大网络空间安全学院本科教育指导小组副组长,主要从事人工智能和自然语言处理方面的研究工作,包括机器翻译、 智能对话、机器阅读理解等。 在ACL,AAAI 、EMNLP、COLING、 ICLR等国际/国内会议及期刊发表论文100余篇,曾获“第四届中国科协期刊优秀学术论文”奖, 2022 ACL杰出论文奖,出版专著2部,获发明专利6项。主持和参加科技部重点研发项目,网络空间安全重点专项,国家863课题,973子课题,自然科学基金项目等20余项。曾担任科技部重点专项,国家自然科学基金和北京市自然科学基金等多种项目评审专家。
在中国科学院大学开设硕士研究生核心课程《自然语言处理基础》和本科生必修课程《计算机组成原理》,在信工所开设博士生课程《基于深度学习的自然语言处理》,各门课程每次教学评估均为优秀,深受学生欢迎。其中,《自然语言处理基础》课程被评为中国科学院大学校级优秀课程,《计算机组成原理》被评为国科大网络空间安全学院优秀课程。
荣获中科院朱李月华优秀教师奖和多次国科大教学优秀奖,具有丰富的学生指导经验,所指导学生成绩优异,其中一人获ACL 2022 杰出论文奖,一人获华为天才少年荣誉称号,多人荣获所级优秀学术干部,科学院院长奖,国家奖学金,北京市优秀毕业生等荣誉称号。
陈钰枫,北京交通大学教授/博士生导师,主要从事多语言/多模态大模型、知识图谱、对话系统等研究,2003年于北京交通大学获得学士学位,2008年于中科院自动化所获得博士学位;2008年至2014年任职于中科院自动化所模式识别国家重点实验室;2014年至今任教于北京交通大学。于曾获钱伟长中文信息处理科学技术奖一等奖。在国内外权威期刊和会议上发表高质量论文100余篇;已申请国家发明专利24项;主持国家自然科学基金面上项目3项、AI2030国家重点研发计划任务1项及省部级项目12项;作为核心成员参加国家自然科学基金重点项目、腾讯校企合作等各类纵横向科研项目30余项。