精通推荐算法:核心模块+经典模型+代码详解
¥89.00定价
作者: 谢杨易
出版时间:2024-06
出版社:电子工业出版社
- 电子工业出版社
- 9787121474514
- 1-2
- 525005
- 48254022-6
- 平塑勒
- 16开
- 2024-06
- 280
- 计算机科学与技术
- 本科 研究生及以上
内容简介
本书系统介绍了推荐算法的知识框架和技术细节,包括召回、粗排、精排和重排等模块。第1章从用户体验、内容生产和平台发展角度介绍为什么需要推荐系统,并阐述推荐系统的分类及整体技术架构。第2章介绍推荐算法模型的基础——数据样本和特征工程。第3章介绍传统推荐算法。第4~7章介绍推荐系统中最复杂的部分——精排模块,包括特征交叉、用户行为序列建模、Embedding表征学习和多任务学习。第8章介绍召回模块,并详细讲解非个性化召回和个性化召回算法。第9章介绍粗排模块,重点讲解特征蒸馏和轻量级特征交叉等方法。第10章介绍重排模块,包括打散和多样性、上下文感知和端上重排等技术细节。
目录
第1章 推荐系统概述 1__eol__1.1 为什么需要推荐系统 1__eol__1.1.1 推荐系统与用户体验 2__eol__1.1.2 推荐系统与内容生产 3__eol__1.1.3 推荐系统与平台发展 4__eol__1.2 推荐系统分类 5__eol__1.2.1 业务领域分类 5__eol__1.2.2 内容介质分类 5__eol__1.2.3 交互形态分类 6__eol__1.2.4 应用场景分类 6__eol__1.3 推荐系统技术架构 7__eol__1.4 本章小结 9__eol__第2章 数据样本和特征工程 10__eol__2.1 数据样本 10__eol__2.1.1 样本不均衡问题 11__eol__2.1.2 样本不置信问题 14__eol__2.1.3 离/在线样本不一致问题 16__eol__2.2 特征工程 17__eol__2.2.1 特征类目体系 18__eol__2.2.2 特征处理范式 21__eol__2.2.3 特征重要性评估 22__eol__2.3 本章小结 23__eol__第3章 传统推荐算法 25__eol__3.1 协同过滤 25__eol__3.1.1 基于用户的协同过滤 26__eol__3.1.2 基于物品的协同过滤 27__eol__3.1.3 协同过滤的优点和局限性 28__eol__3.2 矩阵分解 29__eol__3.2.1 矩阵分解实现方法 30__eol__3.2.2 矩阵分解的优点和局限性 31__eol__3.3 逻辑回归 31__eol__3.3.1 逻辑回归求解过程 33__eol__3.3.2 逻辑回归的优点和局限性 34__eol__3.4 因子分解机 35__eol__3.4.1 因子分解机模型简化 35__eol__3.4.2 因子分解机的优点和局限性 36__eol__3.5 组合模型 37__eol__3.5.1 GBDT + LR组合模型结构 38__eol__3.5.2 GBDT特征转换过程 39__eol__3.5.3 组合模型的思考和总结 40__eol__3.6 本章小结 40__eol__第4章 特征交叉 42__eol__4.1 特征交叉概述 43__eol__4.1.1 特征交叉的意义 43__eol__4.1.2 特征交叉基本范式 44__eol__4.1.3 特征交叉的难点 45__eol__4.2 Deep Crossing:经典DNN框架模型 46__eol__4.2.1 业务背景和特征体系 46__eol__4.2.2 模型结构 48__eol__4.2.3 实现方法 52__eol__4.3 FNN 54__eol__4.3.1 为什么Embedding收敛慢 55__eol__4.3.2 模型结构 55__eol__4.4 PNN 58__eol__4.4.1 模型结构 58__eol__4.4.2 特征交叉实现方法 59__eol__4.5 Wide&Deep:异构模型奠基者 61__eol__4.5.1 “记忆”和“泛化” 61__eol__4.5.2 模型结构 62__eol__4.5.3 系统实现 64__eol__4.5.4 代码解析 66__eol__4.6 DeepFM:异构模型Wide侧引入FM 68__eol__4.6.1 模型结构 68__eol__4.6.2 代码解析 70__eol__4.7 DCN:异构模型Wide侧引入高阶交叉 74__eol__4.8 NFM:异构模型Deep侧引入显式交叉 77__eol__4.9 xDeepFM:异构模型引入子分支 79__eol__4.10 本章小结 83__eol__第5章 用户行为序列建模 85__eol__5.1 用户行为序列建模概述 86__eol__5.1.1 行为序列建模的意义 87__eol__5.1.2 行为序列建模的基本范式 87__eol__5.1.3 行为序列建模的主要难点 88__eol__5.1.4 行为序列特征工程 89__eol__5.2 DIN:基于注意力机制建模用户行为序列 90__eol__5.2.1 背景 90__eol__5.2.2 模型结构 92__eol__5.2.3 模型训练方法 95__eol__5.2.4 代码解析 98__eol__5.3 DIEN:GRU建模用户行为序列 100__eol__5.3.1 模型结构:兴趣抽取层 100__eol__5.3.2 模型结构:兴趣进化层 103__eol__5.4 BST:Transformer建模用户行为序列 105__eol__5.4.1 模型结构 105__eol__5.4.2 代码解析 109__eol__5.5 DSIN:基于Session建模用户行为序列 114__eol__5.6 MIMN:基于神经图灵机建模长周期行为序列 117__eol__5.6.1 工程设计:UIC模块 118__eol__5.6.2 MIMN模型结构 119__eol__5.7 SIM:基于检索建模长周期行为序列 123__eol__5.8 ETA:基于SimHash实现检索索引在线化 126__eol__5.8.1 ETA模型结构 127__eol__5.8.2 SimHash原理 128__eol__5.9 本章小结 129__eol__第6章 Embedding表征学习 131__eol__6.1 Embedding表征学习概述 132__eol__6.1.1 Embedding概述 133__eol__6.1.2 Embedding表征学习的意义 134__eol__6.1.3 Embedding表征学习的基本范式 134__eol__6.1.4 Embedding表征学习的主要难点 135__eol__6.2 基于序列的Embedding建模方法 135__eol__6.2.1 Word2vec任务定义:CBOW和Skip-gram 136__eol__6.2.2 Word2vec模型结构 137__eol__6.2.3 Word2vec训练方法 138__eol__6.2.4 Item2vec:推荐系统引入序列Embedding 139__eol__6.2.5 序列建模总结和思考 139__eol__6.3 基于同构图游走的Graph Embedding 139__eol__6.3.1 DeepWalk:同构图游走算法开山之作 140__eol__6.3.2 LINE:一阶相似度和二阶相似度探索 141__eol__6.3.3 Node2vec:同质性和结构等价性探索 142__eol__6.3.4 同构图游走的优缺点 144__eol__6.4 基于异构图游走的Graph Embedding 145__eol__6.4.1 Metapath2vec 145__eol__6.4.2 EGES 146__eol__6.4.3 异构图游走的优缺点 149__eol__6.5 图神经网络 149__eol__6.5.1 GCN:图神经网络开山之作 149__eol__6.5.2 GraphSAGE:图神经网络工业应用的高潮 152__eol__6.5.3 图神经网络总结 153__eol__6.6 向量检索技术 153__eol__6.6.1 向量距离计算方法 154__eol__6.6.2 向量检索算法 156__eol__6.6.3 向量检索常用工具:Faiss 161__eol__6.7 本章小结 162__eol__第7章 多任务学习 165__eol__7.1 多任务学习发展历程 166__eol__7.1.1 为什么需要多任务学习 166__eol__7.1.2 多任务学习的基本框架 167__eol__7.1.3 多任务学习的难点和挑战 168__eol__7.2 ESMM模型:解决SSB和DS问题的利器 169__eol__7.2.1 样本选择偏差和数据稀疏问题 169__eol__7.2.2 ESMM模型结构 170__eol__7.2.3 ESMM核心代码 172__eol__7.3 MMOE模型:多专家多门控网络 174__eol__7.3.1 MMOE模型结构 174__eol__7.3.2 MMOE核心代码 177__eol__7.4 PLE模型:解决负迁移和跷跷板现象的利器 179__eol__7.4.1 负迁移和跷跷板现象 180__eol__7.4.2 单层CGC模型结构 180__eol__7.4.3 PLE模型结构 183__eol__7.4.4 PLE核心代码 184__eol__7.5 多任务融合 188__eol__7.5.1 网格搜索 189__eol__7.5.2 排序模型 190__eol__7.5.3 强化学习 190__eol__7.6 本章小结 192__eol__第8章 召回算法 194__eol__8.1 召回概述 196__eol__8.1.1 推荐底池 196__eol__8.1.2 多路召回 197__eol__8.1.3 召回的难点 198__eol__8.1.4 召回评价体系 199__eol__8.2