课程大纲

课程大纲

知识图谱

课程编码:081104M05012H 英文名称:Knowledge Graph 课时:40 学分:2.00 课程属性:专业普及课 主讲教师:赵军等

教学目的要求
以知识图谱为核心,使学生掌握知识工程、语义网以及自然语言处理等研究方向中与大数据知识工程密切相关的基本概念、基本方法和关键技术,明确知识图谱构建及应用的研究方向、主要任务和主流方法,使学生能够了解知识图谱发展脉络,激发研究兴趣,思考核心问题,领悟发展方向,核心目标是培养学生的研究兴趣和解决实际问题的能力。
课程基本要求:关于知识图谱全栈技术的综合课程,课程内容覆盖面广,且跨越多个研究方向,因此要求学生应具备较好的数学和算法基础(如高等数学、线性代数、数理逻辑、概率论、离散数学、算法设计与分析等),还应掌握机器学习和深度学习的相关概念、方法及其相应的学习机制,了解自然语言处理若干典型任务(如分类、匹配、序列标注等)的模型、学习方法和领域应用。
考核方式:读书报告和大作业

预修课程
概率论

大纲内容
第一章 知识图谱概述 3学时 赵军
第1节 知识图谱起源与发展脉络
第2节 知识图谱定义与核心价值
第3节 知识图谱生命周期
第4节 知识图谱分类与常见知识图谱
第5节 知识图谱典型应用
第二章 知识表示理论 6学时 赵军
第1节 知识表示概述
第2节 经典知识表示理论
第3节 语义网知识描述体系
第4节 知识图谱中的知识表示
第5节 分布式知识表示
第三章 实体概念知识获取 3学时 赵军
第1节 实体识别概述
第2节 实体识别典型方法
第3节 实体扩展概述
第4节 实体扩展典型方法
第5节 实体分类概述
第6节 实体分类典型方法
第四章 关系事件知识获取 3学时 赵军
第1节 关系抽取概述
第2节 关系抽取典型方法
第3节 事件抽取概述
第4节 事件抽取典型方法
第5节 事件关系抽取典型方法
第五章 知识图谱构建实战 3学时 陈玉博
第1节 领域知识图谱框架构建
第2节 半结构化文本中的知识抽取
第3节 非结构化文本中的知识抽取
第六章 知识图谱数据管理 3学时 陈玉博
第1节 知识图谱数据模型
第2节 知识图谱数据的存储
第3节 知识图谱数据的查询
第4节 知识图谱可视化
第七章 知识建模与融合 3学时 陈玉博
第1节 本体概述
第2节 知识建模方法
第3节 知识融合概述
第4节 知识体系融合典型方法
第5节 知识实例融合典型方法
第八章 知识推理 6学时 何世柱
第1节 基于逻辑的知识推理方法
第2节 归纳逻辑编程
第3节 概率知识推理
第4节 基于路径学习的知识推理
第5节 基于神经网络的知识推理
第6节 混合式知识推理
第7节 知识图谱验证与评价
第九章 知识图谱应用
第1节 问答系统概述 0.5学时 何世柱
第2节 知识问答概述 0.5学时 何世柱
第3节 基于语义匹配的知识图谱问答 1学时 何世柱
第4节 基于语义解析的知识图谱问答 1学时 何世柱
第5节 面向表格数据的问答系统 1学时 何世柱
第6节 对话系统概述 0.5学时 何世柱
第7节 任务型对话典型方法 0.5学时 何世柱
第8节 融合知识的通用对话典型方法 1学时 何世柱
第9节 基于知识的语义搜索概述 0.5学时 陈玉博
第10节 语义搜索的交互范式 0.5学时 陈玉博
第11节 基于知识的推荐概述 1学时 陈玉博
第12节 基于知识的画像 0.5学时 陈玉博
第13节 基于知识的跨领域可解释推荐 0.5学时 陈玉博
第十章 总结 1学时 赵军
第1节 知识图谱研究和实践存在的问题
第2节 知识图谱的发展趋势研讨

参考书

课程教师信息
授课教师简介:
赵军,中国科学院自动化研究所模式识别国家重点实验室,研究员,博士生导师;中国科学院大学人工智能学院岗位教授。研究领域为自然语言处理、知识图谱、信息抽取、问答系统等。作为项目负责人承担国家自然科学基金重点项目等国家级重要科研项目以及蚂蚁金服、云知声、腾讯、阿里、华为等重要企业应用项目。在ACL、IJCAI、SIGIR、AAAI、COLING、EMNLP、TKDE等顶级国际会议和重要学术期刊上发表论文80余篇。曾获第25届国际计算语言学大会COLING 2014最佳论文奖,主持研发的“大规模开放域文本知识获取与应用平台”获得2018年中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。兼任中国中文信息学会常务理事,语言与知识计算专委会副主任,计算语言学专委会副主任,《中文信息学报》编委,ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP)副主编等学术职务。主编教材《知识图谱》于2018年12月由高等教育出版社出版,并被列入“十三五”国家重点图书出版规划(人工智能丛书)。
何世柱,中国科学院自动化研究所模式识别国家重点实验室,副研究员。研究方向为问答系统、对话系统、知识推理和自然语言处理。迄今在包括ACL、EMNLP、IJCAI、AAAI等在内的国际重要会议和期刊上发表多篇学术论文。主持国家自然科学基金青年基金项目1项。现为中国中文信息学会语言与知识计算专委会委员。2018年获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。
陈玉博,博士,中科院自动化所模式识别国家重点实验室助理研究员,2017年获得中国科学院大学工学博士学位。研究方向为信息抽取、知识图谱和自然语言处理。主持国家自然科学基金青年科学基金项目“面向非结构化文本的大规模事件信息抽取关键技术研究”,2018年获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。