好书推荐 好书速递 排行榜 读书文摘

从零构建知识图谱

从零构建知识图谱
作者:邵浩 / 张凯 / 李方圆 / 张云柯 / 戴锡强
副标题:技术、方法与案例
出版社:机械工业出版社
出版年:2021-08
ISBN:9787111686835
行业:其它
浏览数:8

内容简介

这是一本能让读者快速从零开始构建工业级知识图谱的著作。作者是知识图谱和自然语言处理领域的专家,本书得到了OpenKG联合创始人王昊奋、清华大学教授李涓子、东南大学教授漆桂林、美团知识图谱团队负责人张富峥、文因互联创始人鲍捷等学界和业界知识图谱扛旗人的一致好评和推荐。

本书不仅详细讲解了知识图谱的技术原理和构建工具,而且还循序渐进地讲解了知识图谱的构建方法、步骤和行业应用。配有大量实战案例,并且开放了源代码,确保读者能学会并落地。

全书一共8章:

第1章介绍了知识图谱的概念、模式、应用场景和技术架构;

第2章围绕知识图谱的技术体系,详细阐述了知识的表示与建模、抽取与挖掘、存储与融合,以及检索与推理;

第3章通过具体的实例介绍了各种知识图谱工具的使用;

第4章和第5章从工业实践的角度讲解了从0到1构建通用知识图谱和领域知识图谱的步骤和方法,并配备详细的代码解读;

第6~7章讲解了知识图谱的具体应用和一个综合性的知识图谱案例——问答系统,进一步指导读者实践;

第8章对知识图谱的未来发展进行了总结和展望。

◆ 编辑推荐 ◆

(1)作者资深:作者是知识图谱、自然语言处理等领域的资深AI技术专家和算法专家,实战经验丰富。

(2)维度全面:从知识图谱技术原理、构建工具、构建方法、应用案例等多个维度全面展开讲解,理论与实践相结合。

(3)实操性强:手把手教读者从0到1构建工程级知识图谱的步骤和方法,配备源代码。

(4)专家力荐:知识图谱和自然语言处理领域专家撰写,王昊奋、李涓子、漆桂林、张富峥、鲍捷等学术界和企业界的专家一致推荐。

......(更多)

作者简介

邵浩

资深人工智能技术专家,vivo技术总监。曾任狗尾草智能科技AI研究院院长,带领团队打造了虚拟生命产品的交互引擎。上海市静安区首届优秀人才,上海市人才发展基金获得者,杭州市高层次人才。中国中文信息学会青年工作委员会委员,语言与知识计算专委会委员,中国计算机学会语音对话与听觉专委会委员,自然语言处理专委会委员。

日本国立九州大学工学博士,亚利桑那州立大学访问学者,曾任上海对外经贸大学副教授,硕士生导师。共发表论文 50余篇,专利十余项,在国内率先出版了聊天机器人和预训练语言模型相关的著作,主持多项国家级和省部级课题。

张凯

资深AI算法工程师,主要研究方向包括知识图谱、对话系统、推荐系统、机器翻译等,拥有多年算法落地经验。主导构建了开放通用知识图谱七律,参与了《知识图谱评测标准》和《知识图谱白皮书》的编写。聊天机器人专业书籍作者之一。

李方圆

资深AI算法工程师,主要研究方向包括机器翻译、知识图谱和问答系统,具有多年实战项目经验,现任vivo机器翻译团队负责人,主导从零构建机器翻译能力。

张云柯

资深AI算法工程师,中文信息学会会员,硕士毕业于加拿大Queen’s University,曾任职于奇虎360。主要研究方向包括自然语言处理与知识图谱,曾于领域内知名会议发表相关论文,拥有丰富的算法落地经验。

戴锡强

资深AI算法工程师,主要研究方向为知识图谱、对话系统等,参与构建了百科知识图谱,医药领域知识图谱,基于知识图谱的问答系统等,具有丰富的知识图谱落地经验。

......(更多)

目录

推荐序

前言

第1章 知识图谱概览 1

1.1 知识图谱序言 1

1.2 知识图谱基本概念 3

1.2.1 知识图谱背景 3

1.2.2 知识图谱的定义 5

1.2.3 典型知识图谱示例 7

1.3 知识图谱的模式 10

1.4 为什么需要知识图谱 13

1.5 知识图谱的典型应用 15

1.6 知识图谱的技术架构 17

参考文献 18

第2章 知识图谱技术体系 19

2.1 知识表示与知识建模 19

2.1.1 知识表示 19

2.1.2 知识建模 26

2.2 知识抽取与知识挖掘 29

2.2.1 知识抽取 29

2.2.2 知识挖掘 38

2.3 知识存储与知识融合 42

2.3.1 知识存储 42

2.3.2 知识融合 47

2.4 知识检索与知识推理 52

2.4.1 知识检索 53

2.4.2 知识推理 58

参考文献 61

第3章 知识图谱工具 63

3.1 知识建模工具 63

3.1.1 Protégé 64

3.1.2 其他本体建模工具 79

3.1.3 本体建模工具的选择 83

3.2 知识抽取工具 84

3.2.1 DeepDive 84

3.2.2 其他知识抽取工具 102

3.2.3 知识抽取工具对比 106

3.3 知识存储工具 107

3.3.1 Neo4j 108

3.3.2 Neo4j安装与部署 109

3.3.3 可视化 113

3.3.4 图模型 115

3.3.5 其他图数据库 120

参考文献 122

第4章 从零构建通用知识图谱 123

4.1 通用知识表示与抽取 123

4.1.1 通用知识数据来源 123

4.1.2 实体层构建 126

4.1.3 表述层构建 131

4.1.4 概念层构建 134

4.2 知识增强 135

4.2.1 实体层知识增强 135

4.2.2 模式完善 139

4.2.3 实体链接:表述层与实体层之间的映射 144

4.2.4 实体分类:实体层与概念层之间的映射 146

4.3 百科知识存储与更新 153

4.3.1 属性图存储模型 154

4.3.2 知识存储 156

4.3.3 知识更新 168

第5章 领域知识图谱构建 172

5.1 领域知识图谱概览 172

5.2  医药领域知识图谱 173

5.2.1 领域模式构建 174

5.2.2 领域知识抽取 176

5.2.3 领域图谱构建 178

5.2.4 图谱展示 182

5.3 用户画像图谱 183

5.3.1 用户画像知识表示 183

5.3.2 知识抽取和挖掘 185

5.3.3 抽取案例 194

参考文献 207

第6章 知识图谱应用 208

6.1 知识可视化 208

6.1.1 D3 208

6.1.2 ECharts 213

6.1.3 其他工具介绍 220

6.1.4 小结 225

6.2 实体链接 225

6.2.1 实体链接的定义 225

6.2.2 实体链接的步骤 226

6.2.3 实体链接工具 232

6.2.4 实体链接的应用 242

6.3 知识问答 245

6.3.1 知识问答系统概述 245

6.3.2 知识问答系统的主要流程 247

6.3.3 主流知识问答系统介绍 252

6.3.4 问答系统实战 260

6.4 联想 277

6.4.1 联想整体流程 278

6.4.2 话题识别 279

6.4.3 候选话题生成 280

6.4.4 候选话题排序 282

6.4.5 联想回复生成 290

参考文献 292

第7章 基于知识图谱的问答系统 297

7.1 简介 297

7.2 自然语言理解 300

7.2.1 概述 300

7.2.2 基础NLU 301

7.2.3 意图理解 309

7.2.4 实体识别与链接 317

7.2.5 文本相似度与向量化 317

7.3 对话管理 322

7.3.1 概述 322

7.3.2 知识问答 327

7.3.3 闲聊 331

7.4 自然语言生成 332

7.5 服务化 333

参考文献 335

第8章 总结与展望 336

参考文献 338

......(更多)

读书文摘

在计算机和人工智能领域,一种简短的对本体的解释是,本体是一种对于现实世界概念化的规范,即知识的一种抽象模型,抽象了不同实体的特征并将其泛化成不同类和关系。在本体的构建方面,比较经典的方法包括METHONTOLOGY法、七步法等,这些方法的产生通常来源于具体的本体开发项目。

......(更多)

猜你喜欢

点击查看