注册 登录 进入教材巡展
#
  • #

出版时间:2025-02-14

出版社:机械工业出版社

以下为《文本大数据分析方法及应用——基于主题模型和机器学习理论》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111769811
  • 1-1
  • 547179
  • 平装
  • 2025-02-14
  • 178
内容简介
本书基于作者多年来对于文本大数据的研究成果创作完成,主要分 为两部分内容。第一部分包括前 5 章,基于主题模型,首先介绍了基础 的主题模型及其推断、评价方法,然后介绍了多语料联合、动态稀疏等 多角度的主题模型,以及主题模型的变点检测方法。第二部分包括后 3 章,基于机器学习和深度学习模型,包括文本分层分类模型、异质图新 闻推荐模型以及基于多层级信息的多模态属性级情感分析模型。书中每 种方法均配有实际分析案例。本书对文本分析方法的理论研究和实践应 用有重要参考价值,可作为大学相关专业高年级本科生或研究生的入门教材,也可作为从事相关技术研发的开发人员的参考书。
目录
目录
前言
第 1 章 主题模型简介 1
1.1 基本概念与符号 2
1.2 基础主题模型 3
1.2.1 LDA 模型 3
1.2.2 DTM 模型 5
1.3 参数推断方法 6
1.3.1 变分贝叶斯 6
1.3.2 Gibbs 抽样 11
1.4 评价指标 14
1.4.1 评价模型的泛化
能力 14
1.4.2 评价主题内部的
一致性 15
1.4.3 评价不同主题间的
相似性 16
1.5 实例应用 16
1.6 模型拓展 18
1.6.1 短文本建模 19
1.6.2 有监督模型 20
1.6.3 词向量主题模型 21
参考文献 21
附录:Dirichlet-Multinomial
共轭结构 22
第 2 章 多语料联合主题模型 24
2.1 基本概念与符号 25
2.2 多语料联合主题模型 26
2.2.1 模型生成过程 26
2.2.2 最大熵模型 28
2.3 参数推断方法 29
2.3.1 模型推断 29
2.3.2 超参确定 31
2.4 实例应用 32
2.4.1 护肤品数据集 32
2.4.2 连锁日本餐厅
数据集 36
2.5 讨论 42
参考文献 42
第 3 章 动态稀疏主题模型 43
3.1 基本概念与符号 44
3.2 动态稀疏主题模型 45
3.2.1 模型介绍 45
3.2.2 模型生成过程 46
3.3 参数推断方法 47
3.3.1 零阶坍塌变分贝叶
斯推断算法 48
3.3.2 参数估计 49
3.3.3 推断算法 51
3.4 实例应用 52
3.4.1 JASA 数据集 52
3.4.2 研究生论文语
料库 55
3.5 讨论 58
参考文献 59
第 4 章 动态稀疏联合主题
模型 61
4.1 基本概念与符号 62
4.2 动态稀疏联合主题模型 63
4.3 参数推断方法 66
4.3.1 变分贝叶斯 EM
算法 67
4.3.2 变分卡尔曼滤波
算法 70
4.3.3 推断算法 71
4.4 实例应用 72
4.5 讨论 78
参考文献 78
第 5 章 混合贝叶斯变点检测
模型 80
5.1 基本概念与符号 81
5.2 混合贝叶斯变点检测
模型 82
5.3 参数推断方法 84
5.4 实例应用 87
5.4.1 亚马逊评论数
据集 87
5.4.2 期刊数据集 90
5.4.3 联合国数据集 93
5.5 讨论 96
参考文献 96
第 6 章 文本分层分类模型 98
6.1 基本概念与符号 99
6.2 文本分层分类模型 100
6.2.1 H.S. 性质 100
6.2.2 分层结构中节点间的
不相似度 103
6.2.3 基于角的分层分
类器 105
6.3 模型求解算法 109
6.3.1 标签嵌入法 109
6.3.2 线性损失 115
6.4 实例应用 116
6.4.1 评价指标 116
6.4.2 实证分析 118
6.5 讨论 122
参考文献 122
第 7 章 异质图新闻推荐模型 124
7.1 基本概念与符号 125
7.2 异质图新闻推荐模型 126
7.2.1 准备知识 126
7.2.2 模型简介 126
7.2.3 节点特征准备 127
7.2.4 异质邻居采样 129
7.2.5 信息聚合与
预测 129
7.3 实例应用 133
7.3.1 数据集与对比
模型 133
7.3.2 实验结果 134
7.4 讨论 137
参考文献 137
第 8 章 基于多层级信息的多模态
属性级情感分析模型 139
8.1 基本概念与符号 140
8.2 基于多层级信息的多模态
属性级情感分析模型 141
8.2.1 基础模型 141
8.2.2 多模态联合模型 142
8.3 实例应用 150
8.3.1 数据集介绍 150
8.3.2 评估指标 152
8.3.3 基线模型 153
8.3.4 实验结果 153
8.4 讨论 157
参考文献 158