课程大纲

课程大纲

自然语言处理实战

课程编码:1802030839X2P5003H 英文名称:Natural Language Processing Practice and Application 课时:30 学分:1.00 课程属性:实验课 主讲教师:方芳等

教学目的要求
自然语言处理关注如何让机器更好地理解人类语言。近年来,随着深度学习技术的发展,自然语言处理在人工智能领域备受瞩目。深度语言模型、文本分类、文本生成等技术已在业界成熟应用,且影响到我们生活的方方面面。本课程一方面讲解基于深度学习的自然语言处理方法和模型,另一方面围绕深度语言模型、文本分类、智能问答等实际应用,介绍相关理论知识和实践技巧,帮助学生学习如何快速搭建一个面向应用的自然语言处理系统。

预修课程
自然语言处理、深度学习、机器学习

大纲内容
第一章 自然语言处理基础方法介绍 3学时 方芳
第1节 基于规则的自然语言处理方法
第2节 统计自然语言处理方法
第3节 语言学基础任务
第二章 神经网络基础与自然语言算法包使用实战 4学时 方芳
第1节 深度学习坏境配置
第2节 Pytorch搭建神经网络过程实现
第3节 传统神经网络(BP神经网络)方法实现
第4节 自然语言处理算法包使用实战
第5节 相关代码实操与答疑
第三章 神经网络语言模型介绍 3学时 方芳
第1节 浅层词嵌入表示学习介绍
第2节 循环神经网络语言模型
第3节 预训练模型介绍
第四章 词嵌入表示学习实战 2学时 方芳
第1节 基于统计语言模型的词嵌入表示方法实现
第2节 基于word2vec的词嵌入表示方法实现
第五章 基于词嵌入表示的文本分类实战 2学时 方芳
第1节 文本分类任务介绍
第2节 基于词嵌入表示的文本分类方法实现
第3节 相关代码实操与答疑
第六章 基于循环神经网络的文本分类实战 4学时 方芳
第1节 基于卷积神经网络的文本分类实现
第2节 基于循环神经网络的文本分类实现
第3节 基于注意力机制的文本分类实现
第4节 相关代码实操与答疑
第七章 基于预训练的文本分类和有害内容审核实战 4学时 方芳
第1节 基于预训练的文本分类实现
第2节 有害内容审核应用与模型设计
第3节 相关代码实操与答疑
第八章 命名实体识别任务实战 4学时 任昱冰
第1节 命名实体任务介绍
第2节 基于传统方法的命名实体识别实现
第3节 基于深度学习的命名实体识别实现
第4节 相关代码实操与答疑
第九章 自动文摘系统实战 4学时 任昱冰
第1节 自动文摘任务介绍
第2节 抽取式自动文摘实现
第3节 生成式自动文摘实现
第4节 相关代码实操与答疑

参考书
1、 《自然语言处理从入门到实战》 胡盼盼 著 2020年6月 中国铁道出版社
2、 《自然语言处理实战》 霍布森莱恩,科尔霍华德,汉纳斯马克斯哈普克 著,史亮,鲁骁,唐可欣,王斌 译 2020年10月 人民邮电出版社
3、 《基于BERT模型的自然语言处理实战》 李金洪 著 2021年7月 电子工业出版社

课程教师信息
方芳,中国科学院信息工程研究所副研究员,在ACL、AAAI、 EMNLP、COLING等知名国际期刊和会议上发表学术论文20余篇,申请专利近10项。获PAKDD-2020年最佳论文奖、中国电子学会科技进步二等奖、CCL2022事件关系分析比赛第一名。担任CIPS青工委委员,主持或参与省部级项目10余项,经费超1000万。

任昱冰,中国科学院信息工程研究所副研究员,入选信工所优才计划。在顶级会议上发表学术论文10余篇,以第一作者在ACL、SIGIR、COLING等A/B类国际会议中发表论文6篇,获CCL2022新闻脉络检测任务第一名。担任CIPS大模型专委会委员,参与国家重点研发计划、多项信息安全专项及国防项目等。