- 电子工业出版社
- 9787121499166
- 1-2
- 560127
- 60266965-7
- 平塑勒
- 16开
- 2025-08
- 540
- 416
- 工学
- 计算机类
- 计算机科学与技术
- 本科 研究生及以上
内容简介
全书共分10 章,全面介绍知识增强大模型涉及的各类技术,涵盖大模型、向量数据库、图数据库、知识图谱、检索增强生成、GraphRAG 等内容,并辅以丰富的实例、精心绘制的插图和深入浅出的技术解析,帮助读者快速掌握知识增强大模型的理论,引导读者逐步构建知识增强大模型应用。
目录
第1章 绪论:迎接大模型纪元 0
1.1 大模型崛起 2
1.2 大模型的固有特性 4
1.2.1 幻觉 5
1.2.2 知识陈旧 6
1.3 知识增强大模型 6
1.4 迎接大模型纪元 8
第2章 大语言模型 10
2.1 大模型概述 12
2.2 语言模型简史 14
2.3 大模型为何如此强大 20
2.3.1 语言模型与无监督学习 21
2.3.2 人类反馈强化学习 22
2.3.3 情境学习与思维链 24
2.4 如何使用大模型 29
2.4.1 翻译 30
2.4.2 文本摘要 31
2.4.3 求解数学问题 31
2.4.4 语言学习和考试 32
2.4.5 高效撰写文章 34
2.4.6 自动化编程和辅助编程 35
2.4.7 数据分析 38
2.5 垂直大模型 40
2.5.1 什么是垂直大模型 41
2.5.2 垂直大模型的特点 41
2.6 思考题 42
2.7 本章小结 43
第3章 向量数据库 44
3.1 向量表示与嵌入 46
3.1.1 语言的向量表示 47
3.1.2 图像的向量表示 48
3.1.3 知识图谱的向量表示 49
3.2 向量相似度 49
3.2.1 L2距离 50
3.2.2 余弦相似度 51
3.2.3 内积相似度 52
3.2.4 L1距离 53
3.3 向量索引与检索方法 54
3.3.1 最近邻检索和近似最近邻检索 55
3.3.2 局部敏感哈希算法 56
3.3.3 基于图结构的HNSW算法 58
3.3.4 向量量化与乘积量化 63
3.4 Milvus向量数据库 65
3.4.1 Milvus架构 66
3.4.2 向量索引方法 68
3.4.3 向量检索方法 70
3.4.4 数据一致性 70
3.4.5 用户认证与权限控制 72
3.5 Milvus向量数据库实战指南 73
3.5.1 安装、配置和运行Milvus 73
3.5.2 连接服务器和创建数据库 75
3.5.3 数据准备 76
3.5.4 创建集合 77
3.5.5 创建索引 80
3.5.6 插入数据 81
3.5.7 载入数据 82
3.5.8 标量查询 83
3.5.9 单向量检索 84
3.5.10 混合检索 87
3.6 其他主流的向量数据库系统与工具 91
3.6.1 原生向量数据库 91
3.6.2 数据库的向量处理扩展 92
3.6.3 向量索引和检索库 93
3.7 思考题 94
3.8 本章小结 94
第4章 检索增强生成 96
4.1 检索增强生成概述 98
4.2 为什么需要RAG 99
4.2.1 RAG、SFT与LoRA 99
4.2.2 长上下文与RAG 102
4.2.3 锂电池供应链管理案例 103
4.2.4 RAG的特点 105
4.3 通用的RAG流程 106
4.3.1 创建知识库 107
4.3.2 知识检索 107
4.3.3 大模型生成答案 108
4.3.4 质量评估与迭代优化 109
4.4 使用Dify构建RAG系统 110
4.4.1 Dify概述 110
4.4.2 安装Dify 111
4.4.3 初始化Dify 115
4.4.4 创建知识库 116
4.4.5 简单的RAG应用 119
4.4.6 RAG效果优化 121
4.4.7 引入Elasticsearch 123
4.4.8 构建RAG系统 129
4.5 RAG系统的最佳实践 135
4.5.1 文本分块 135
4.5.2 分层检索 136
4.5.3 查询改写 137
4.5.4 检索路由 138
4.6 其他主流的RAG系统框架 138
4.6.1 LobeChat 138
4.6.2 Quivr 139
4.6.3 LlamaIndex 139
4.6.4 Open WebUI 139
4.7 思考题 140
4.8 本章小结 140
第5章 知识图谱技术体系 142
5.1 什么是知识图谱 144
5.1.1 知识图谱的相关概念及其定义 144
5.1.2 知识图谱实例 146
5.1.3 大脑的联想机制与知识图谱的关系建模 147
5.2 DIKW模型与知识图谱 149
5.2.1 DIKW模型 149
5.2.2 从DIKW模型到知识图谱 150
5.2.3 知识图谱的内涵与外延 151
5.2.4 知识的源流与知识图谱 152
5.3 知识图谱的技术体系 153
5.3.1 知识图谱模式设计与管理 153
5.3.2 知识图谱构建技术 154
5.3.3 知识图谱存储技术 156
5.3.4 知识图谱应用技术 156
5.3.5 用户接口与界面 158
5.4 知识图谱模式设计的基本原则 159
5.4.1 赋予一类事物合适的名字 159
5.4.2 建立事物间清晰的联系 160
5.4.3 明确且正式的语义表达 161
5.5 知识图谱模式设计的六韬法 162
5.6 大模型结合六韬法设计知识图谱模式 165
5.6.1 场景:对齐参与各方的认知 166
5.6.2 复用:站在巨人的肩膀上 168
5.6.3 事物:定义实体类型及属性 169
5.6.4 联系:场景需求之下的普遍联系 173
5.6.5 约束:多层次的约束规范 176
5.6.6 评价:迭代优化的起点 182
5.7 知识图谱模式设计的最佳实践 182
5.7.1 熟知知识图谱及其具体应用领域 183
5.7.2 明确边界,切记贪多嚼不烂 183
5.7.3 高内聚、低耦合 184
5.7.4 充分利用可视化工具 185
5.8 思考题 186
5.9 本章小结 187
第6章 构建知识图谱 188
6.1 知识图谱构建技术概述 190
6.1.1 映射式构建技术 190
6.1.2 抽取式构建技术 192
6.2 抽取实体和实体属性 193
6.2.1 实体、实体属性及其抽取 193
6.2.2 用大模型抽取实体和实体属性 196
6.3 抽取关系和关系属性 205
6.3.1 实体间的关系和关系抽取 205
6.3.2 用大模型抽取关系和关系属性 210
6.4 抽取事件 214
6.4.1 事件、事件要素和事件抽取 214
6.4.2 用大模型抽取事件 217
6.5 多语言和跨语言 222
6.6 知识抽取的评价指标 223
6.7 思考题 226
6.8 本章小结 227
第7章 图数据库与图计算 228
7.1 图数据库概述 230
7.1.1 顶点、边、属性与标签 230
7.1.2 图数据库的存储与查询 231
7.1.3 主流的图数据库 231
7.2 JanusGraph分布式图数据库 232
7.2.1 JanusGraph系统架构 233
7.2.2 CAP理论与JanusGraph 234
7.2.3 与搜索引擎的集成 235
7.2.4 事务和故障修复 235
7.2.5 属性图模式的定
1.1 大模型崛起 2
1.2 大模型的固有特性 4
1.2.1 幻觉 5
1.2.2 知识陈旧 6
1.3 知识增强大模型 6
1.4 迎接大模型纪元 8
第2章 大语言模型 10
2.1 大模型概述 12
2.2 语言模型简史 14
2.3 大模型为何如此强大 20
2.3.1 语言模型与无监督学习 21
2.3.2 人类反馈强化学习 22
2.3.3 情境学习与思维链 24
2.4 如何使用大模型 29
2.4.1 翻译 30
2.4.2 文本摘要 31
2.4.3 求解数学问题 31
2.4.4 语言学习和考试 32
2.4.5 高效撰写文章 34
2.4.6 自动化编程和辅助编程 35
2.4.7 数据分析 38
2.5 垂直大模型 40
2.5.1 什么是垂直大模型 41
2.5.2 垂直大模型的特点 41
2.6 思考题 42
2.7 本章小结 43
第3章 向量数据库 44
3.1 向量表示与嵌入 46
3.1.1 语言的向量表示 47
3.1.2 图像的向量表示 48
3.1.3 知识图谱的向量表示 49
3.2 向量相似度 49
3.2.1 L2距离 50
3.2.2 余弦相似度 51
3.2.3 内积相似度 52
3.2.4 L1距离 53
3.3 向量索引与检索方法 54
3.3.1 最近邻检索和近似最近邻检索 55
3.3.2 局部敏感哈希算法 56
3.3.3 基于图结构的HNSW算法 58
3.3.4 向量量化与乘积量化 63
3.4 Milvus向量数据库 65
3.4.1 Milvus架构 66
3.4.2 向量索引方法 68
3.4.3 向量检索方法 70
3.4.4 数据一致性 70
3.4.5 用户认证与权限控制 72
3.5 Milvus向量数据库实战指南 73
3.5.1 安装、配置和运行Milvus 73
3.5.2 连接服务器和创建数据库 75
3.5.3 数据准备 76
3.5.4 创建集合 77
3.5.5 创建索引 80
3.5.6 插入数据 81
3.5.7 载入数据 82
3.5.8 标量查询 83
3.5.9 单向量检索 84
3.5.10 混合检索 87
3.6 其他主流的向量数据库系统与工具 91
3.6.1 原生向量数据库 91
3.6.2 数据库的向量处理扩展 92
3.6.3 向量索引和检索库 93
3.7 思考题 94
3.8 本章小结 94
第4章 检索增强生成 96
4.1 检索增强生成概述 98
4.2 为什么需要RAG 99
4.2.1 RAG、SFT与LoRA 99
4.2.2 长上下文与RAG 102
4.2.3 锂电池供应链管理案例 103
4.2.4 RAG的特点 105
4.3 通用的RAG流程 106
4.3.1 创建知识库 107
4.3.2 知识检索 107
4.3.3 大模型生成答案 108
4.3.4 质量评估与迭代优化 109
4.4 使用Dify构建RAG系统 110
4.4.1 Dify概述 110
4.4.2 安装Dify 111
4.4.3 初始化Dify 115
4.4.4 创建知识库 116
4.4.5 简单的RAG应用 119
4.4.6 RAG效果优化 121
4.4.7 引入Elasticsearch 123
4.4.8 构建RAG系统 129
4.5 RAG系统的最佳实践 135
4.5.1 文本分块 135
4.5.2 分层检索 136
4.5.3 查询改写 137
4.5.4 检索路由 138
4.6 其他主流的RAG系统框架 138
4.6.1 LobeChat 138
4.6.2 Quivr 139
4.6.3 LlamaIndex 139
4.6.4 Open WebUI 139
4.7 思考题 140
4.8 本章小结 140
第5章 知识图谱技术体系 142
5.1 什么是知识图谱 144
5.1.1 知识图谱的相关概念及其定义 144
5.1.2 知识图谱实例 146
5.1.3 大脑的联想机制与知识图谱的关系建模 147
5.2 DIKW模型与知识图谱 149
5.2.1 DIKW模型 149
5.2.2 从DIKW模型到知识图谱 150
5.2.3 知识图谱的内涵与外延 151
5.2.4 知识的源流与知识图谱 152
5.3 知识图谱的技术体系 153
5.3.1 知识图谱模式设计与管理 153
5.3.2 知识图谱构建技术 154
5.3.3 知识图谱存储技术 156
5.3.4 知识图谱应用技术 156
5.3.5 用户接口与界面 158
5.4 知识图谱模式设计的基本原则 159
5.4.1 赋予一类事物合适的名字 159
5.4.2 建立事物间清晰的联系 160
5.4.3 明确且正式的语义表达 161
5.5 知识图谱模式设计的六韬法 162
5.6 大模型结合六韬法设计知识图谱模式 165
5.6.1 场景:对齐参与各方的认知 166
5.6.2 复用:站在巨人的肩膀上 168
5.6.3 事物:定义实体类型及属性 169
5.6.4 联系:场景需求之下的普遍联系 173
5.6.5 约束:多层次的约束规范 176
5.6.6 评价:迭代优化的起点 182
5.7 知识图谱模式设计的最佳实践 182
5.7.1 熟知知识图谱及其具体应用领域 183
5.7.2 明确边界,切记贪多嚼不烂 183
5.7.3 高内聚、低耦合 184
5.7.4 充分利用可视化工具 185
5.8 思考题 186
5.9 本章小结 187
第6章 构建知识图谱 188
6.1 知识图谱构建技术概述 190
6.1.1 映射式构建技术 190
6.1.2 抽取式构建技术 192
6.2 抽取实体和实体属性 193
6.2.1 实体、实体属性及其抽取 193
6.2.2 用大模型抽取实体和实体属性 196
6.3 抽取关系和关系属性 205
6.3.1 实体间的关系和关系抽取 205
6.3.2 用大模型抽取关系和关系属性 210
6.4 抽取事件 214
6.4.1 事件、事件要素和事件抽取 214
6.4.2 用大模型抽取事件 217
6.5 多语言和跨语言 222
6.6 知识抽取的评价指标 223
6.7 思考题 226
6.8 本章小结 227
第7章 图数据库与图计算 228
7.1 图数据库概述 230
7.1.1 顶点、边、属性与标签 230
7.1.2 图数据库的存储与查询 231
7.1.3 主流的图数据库 231
7.2 JanusGraph分布式图数据库 232
7.2.1 JanusGraph系统架构 233
7.2.2 CAP理论与JanusGraph 234
7.2.3 与搜索引擎的集成 235
7.2.4 事务和故障修复 235
7.2.5 属性图模式的定













