自然语言处理
课程编码:0839X2M04001H
英文名称:Natural Language Processing
课时:60
学分:3.00
课程属性:专业核心课
主讲教师:胡玥等
教学目的要求
本课程为信息内容处理方向研究生的专业核心课。本课程主要系统的讲授深度学习框架下自然语言处理基础性概念、方法、理论和当前自然语言处理新技术。课程的目的及任务是:使学生通过本课程的学习,掌握统计自然语言处理的理论和方法,了解领域前沿动态,为今后在相关领域开展研究工作打下基础。
预修课程
概率论与数理统计,机器学习(深度学习),形式语言,信息论,计算机算法分析
大纲内容
第一章 绪论 2.0学时 胡玥
第1节 自然语言处理概述
第2节 自然语言处理发展历史及学派
第3节 自然语言处理体系框架
第二章 语料库与语言知识库 1.0学时 胡玥
第1节 语料库概述
第2节 典型语料库资源
第3节 语言知识库
第三章 深度学习基础 9.0学时 胡玥
第1节 前馈神经网络
第2节 卷积神经网络
第3节 图卷积神经网络
第4节 循环神经网络
第四章 语言模型与词向量 6.0学时 胡玥
第1节 统计语言模型
第2节 神经网络语言模型
第3节 词向量
第五章 NLP中的注意力机制 3.0学时 胡玥
第1节 传统注意力机制
第2节 注意力编码机制
第六章 NLP基础任务 9.0学时 胡玥
第1节 文本分类
第2节 文本匹配
第3节 序列标注
第4节 序列生成
第七章 预训练语言模型 6.0学时 胡玥
第1节 预训练语言模型概述
第2节 典型的预训练语言模型
第3节 预训练语言模型应用
第八章 神经机器翻译 3.0学时 胡玥
第1节 典型神经机器翻译模型
第2节 神经机器翻译模型改进
第3节 神经机器翻译语料资源
第九章 情感分析 3.0学时 于静
第1节 情感分类
第2节 属性级情感分类
第十章 信息抽取 6.0学时 于静
第1节 实体识别与抽取
第2节 实体消歧
第3节 关系抽取
第4节 事件抽取
第十一章 智能问答 12.0学时 于静
第1节 问答系统
第2节 机器阅读理解
第3节 多轮对话系统
第十二章 期末考试 3.0学时 于静
第1节 期末考试
参考书
课程教师信息
胡玥,现任中国科学院大学岗位教授/博士生导师,中国科学院信息工程研究所研究员/博士生导师、信工所学位委员会委员。主要研究方向为自然语言处理和人工智能。曾主持和参加科技部重点研发项目,网络空间安全重点专项,国家863课题,973子课题,自然科学基金项目等20余项,在ACL,AAAI等国际/国内会议及期刊发表论文70余篇,曾获“第四届中国科协期刊优秀学术论文”奖,出版专著2部,获发明专利6项。指导的研究生成绩优异,多人荣获国家奖学金,科学院院长奖,优秀毕业生等荣誉称号。
于静 ,中国科学院信息工程研究所副研究员,硕导。担任CCF YOCSEF学术委员会委员、学术秘书(2022-2023),CCF多媒体技术专业委员会委员。于静致力于跨模态智能理解、自然语言处理等领域研究。在TIP、TMM、PR等国际期刊和ICML、CVPR、AAAI, ACM MM、IJCAI等国际会议发表学术论文40余篇,亦担任TMM、PR、CVPR、ICCV、ECCV、AAAI、IJCAI等学术期刊和会议审稿人。主持和参与国家自然科学基金、国家重点研发计划项目、中科院战略性先导科技专项项目等各类国家级/省部级科研课题10余项。 个人主页:https://mmlab-iie.github.io/