智能制造大数据分析技术及应用导论 / 战略性新兴领域“十四五”高等教育系列教材
¥59.00定价
作者: 胡文凯,丁敏,徐达,安剑奇
出版时间:2025-04-15
出版社:机械工业出版社
- 机械工业出版社
- 9787111776413
- 1-1
- 547335
- 平装
- 2025-04-15
- 374
内容简介
本书以智能制造为载体,以数据挖掘技术为主线,系统地介绍了智能制造中的大数据分析技术与应用,不仅涵盖了数据分析与挖掘的基础理论,还通过引入不同制造业领域的案例,使抽象的理论知识具体化,便于读者理解。全书共8章,第1~3章从工业制造过程的基本概念和大数据分析需求出发,介绍数据分析的理论框架、数据基本知识和数据预处理技术;第4~8章深入数据挖掘与分析技术,涵盖频繁模式挖掘、聚类分析、分类分析和回归分析,并以实际工业案例展示技术应用。
本书可作为自动化、计算机、智能制造等专业大数据分析相关课程的教材,也适合作为相关领域研究人员和从业人员的参考书籍。
本书配有PPT课件、教学大纲、习题答案、实验项目等教学资源,欢迎选用本书作教材的教师登录www.cmpedu.com注册后下载,或发邮件至jinacmp@163.com索取。
本书可作为自动化、计算机、智能制造等专业大数据分析相关课程的教材,也适合作为相关领域研究人员和从业人员的参考书籍。
本书配有PPT课件、教学大纲、习题答案、实验项目等教学资源,欢迎选用本书作教材的教师登录www.cmpedu.com注册后下载,或发邮件至jinacmp@163.com索取。
目录
第1章 智能制造大数据概述 1
1.1 工业制造过程概述 1
1.1.1 工业制造过程的基本概念 1
1.1.2 制造业发展阶段 3
1.1.3 制造业发展战略 5
1.2 智能制造的基本概念 6
1.2.1 智能制造的定义 6
1.2.2 智能制造的发展历程 6
1.2.3 智能制造的发展方向 7
1.3 工业大数据的基本概念 8
1.3.1 工业大数据的定义 9
1.3.2 工业大数据的来源与类型 9
1.3.3 工业大数据的特征 11
1.3.4 工业大数据的采集 12
1.4 智能制造大数据分析需求与流程 14
1.4.1 智能制造大数据分析需求 14
1.4.2 智能制造大数据分析流程 15
本章小结 17
思考题与习题 17
参考文献 17
第2章 数据基本知识 19
2.1 数据的基本概念 19
2.1.1 标称属性 20
2.1.2 序数属性 20
2.1.3 数值属性 21
2.1.4 连续属性与离散属性 21
2.2 数据的基本统计描述 21
2.2.1 中心趋势度量 22
2.2.2 离散趋势度量 23
2.3 数据的可视化描述 25
2.4 数据的相似性和相异性 30
2.4.1 相似性和相异性度量的基本概念 30
2.4.2 数值属性的相似性和相异性度量 30
2.4.3 标称属性的相似性和相异性度量 34
2.5 相关关系与因果关系 38
2.5.1 相关关系分析 38
2.5.2 因果关系分析 42
本章小结 43
思考题与习题 44
参考文献 45
第3章 数据预处理 46
3.1 工业数据质量 46
3.1.1 数据质量特性及问题 46
3.1.2 数据预处理的主要任务 48
3.2 数据清洗 49
3.2.1 缺失值填补 49
3.2.2 噪声清洗 51
3.2.3 异常值清洗 55
3.2.4 格式内容清洗 57
3.2.5 逻辑错误清洗 58
3.3 数据集成 58
3.3.1 实体识别问题 58
3.3.2 冗余问题 59
3.3.3 数据冲突问题 59
3.4 数据归约 60
3.4.1 维归约 60
3.4.2 数量归约 64
3.5 数据变换 67
3.5.1 数据规范化 67
3.5.2 数据离散化 69
本章小结 70
思考题与习题 70
参考文献 72
第4章 频繁模式挖掘 73
4.1 频繁模式挖掘的基本概念 73
4.1.1 项与项集、事务、事务数据库 73
4.1.2 模式支持度与频繁模式 75
4.2 频繁项集挖掘 76
4.2.1 Apriori算法 76
4.2.2 FP-Growth算法 78
4.2.3 垂直数据结构算法 84
4.2.4 模式压缩 86
4.3 关联规则挖掘 90
4.3.1 关联规则的产生 90
4.3.2 关联规则的评估 92
4.4 序列模式挖掘 96
4.4.1 序列模式挖掘的基本概念 97
4.4.2 PrefixSpan算法 97
本章小结 100
思考题与习题 100
参考文献 102
第5章 聚类分析 104
5.1 聚类分析的基本概念 104
5.1.1 聚类分析的概念与作用 104
5.1.2 聚类算法的性能要求 106
5.2 划分聚类方法 107
5.2.1 K-means算法 108
5.2.2 K-means++算法 111
5.2.3 K-medoids算法 114
5.3 层次聚类方法 118
5.3.1 算法的距离度量方法 119
5.3.2 凝聚的与分裂的层次聚类 120
5.4 基于密度的聚类方法 125
5.5 聚类分析性能评估 131
5.6 实例 133
本章小结 137
思考题与习题 137
参考文献 139
第6章 分类分析 140
6.1 分类分析的基本概念 140
6.1.1 分类分析的基本原理 141
6.1.2 主要分类方法 141
6.2 决策树 142
6.2.1 决策树的基本原理 142
6.2.2 属性选择度量 145
6.2.3 树剪枝 147
6.2.4 决策树算法 148
6.3 支持向量机 154
6.3.1 支持向量机的基本原理 154
6.3.2 支持向量机求解 157
6.4 人工神经网络 160
6.4.1 人工神经网络拓扑 160
6.4.2 反向传播过程 161
6.5 贝叶斯分类 166
6.5.1 贝叶斯分类的基本原理 166
6.5.2 朴素贝叶斯分类 167
6.6 分类模型的评价与选择 170
6.6.1 分类器的评价方法 170
6.6.2 分类器的评价指标 171
6.6.3 分类器的选择方法 174
6.7 组合分类技术 176
6.7.1 组合分类方法简介 177
6.7.2 装袋算法 177
6.7.3 提升算法 178
6.8 实例 180
本章小结 184
思考题与习题 184
参考文献 187
第7章 回归分析 189
7.1 回归分析的基本概念 189
7.1.1 导引 189
7.1.2 回归分析的主要步骤 190
7.2 线性回归 194
7.2.1 线性回归模型 194
7.2.2 最小二乘估计 194
7.2.3 加权最小二乘估计 197
7.2.4 极大似然估计 198
7.3 高维回归系数压缩 200
7.3.1 共线性的来源及影响 200
7.3.2 岭回归 202
7.3.3 LASSO回归 205
7.3.4 主成分回归 206
7.3.5 偏最小二乘回归 207
7.4 非线性回归 208
7.4.1 非线性回归模型 208
7.4.2 非线性最小二乘 209
7.4.3 支持向量回归 211
7.5 回归模型的评估 214
7.5.1 残差分析 214
7.5.2 拟合效果度量 216
本章小结 217
思考题与习题 217
参考文献 218
第8章 工业应用实例 220
8.1 高炉炼铁基本原理 220
8.1.1 高炉炼铁的背景与工艺原理 221
8.1.2 高炉操作对高炉状态的影响 222
8.1.3 所使用高炉相关数据介绍 222
8.2 高炉数据预处理 224
8.2.1 高炉数据特性分析 224
8.2.2 高炉数据去噪处理 224
8.2.3 高炉数据规范化 226
8.3 高炉参数的相关性分析 226
8.3.1 高炉操作参数间的相关性分析 226
8.3.2 高炉操作参数与状态参数间的相关性分析 227
8.3.3 高炉参数的自相关性分析 227
8.4 高炉操作参数状态聚类与炉况划分 228
8.5 基于分类分析的异常炉况诊断 231
8.6 高炉煤气利用率拟合与预测 233
8.6.1 最小二乘回归分析 233
8.6.2 支持向量回归分析 234
本章小结 238
参考文献 238
1.1 工业制造过程概述 1
1.1.1 工业制造过程的基本概念 1
1.1.2 制造业发展阶段 3
1.1.3 制造业发展战略 5
1.2 智能制造的基本概念 6
1.2.1 智能制造的定义 6
1.2.2 智能制造的发展历程 6
1.2.3 智能制造的发展方向 7
1.3 工业大数据的基本概念 8
1.3.1 工业大数据的定义 9
1.3.2 工业大数据的来源与类型 9
1.3.3 工业大数据的特征 11
1.3.4 工业大数据的采集 12
1.4 智能制造大数据分析需求与流程 14
1.4.1 智能制造大数据分析需求 14
1.4.2 智能制造大数据分析流程 15
本章小结 17
思考题与习题 17
参考文献 17
第2章 数据基本知识 19
2.1 数据的基本概念 19
2.1.1 标称属性 20
2.1.2 序数属性 20
2.1.3 数值属性 21
2.1.4 连续属性与离散属性 21
2.2 数据的基本统计描述 21
2.2.1 中心趋势度量 22
2.2.2 离散趋势度量 23
2.3 数据的可视化描述 25
2.4 数据的相似性和相异性 30
2.4.1 相似性和相异性度量的基本概念 30
2.4.2 数值属性的相似性和相异性度量 30
2.4.3 标称属性的相似性和相异性度量 34
2.5 相关关系与因果关系 38
2.5.1 相关关系分析 38
2.5.2 因果关系分析 42
本章小结 43
思考题与习题 44
参考文献 45
第3章 数据预处理 46
3.1 工业数据质量 46
3.1.1 数据质量特性及问题 46
3.1.2 数据预处理的主要任务 48
3.2 数据清洗 49
3.2.1 缺失值填补 49
3.2.2 噪声清洗 51
3.2.3 异常值清洗 55
3.2.4 格式内容清洗 57
3.2.5 逻辑错误清洗 58
3.3 数据集成 58
3.3.1 实体识别问题 58
3.3.2 冗余问题 59
3.3.3 数据冲突问题 59
3.4 数据归约 60
3.4.1 维归约 60
3.4.2 数量归约 64
3.5 数据变换 67
3.5.1 数据规范化 67
3.5.2 数据离散化 69
本章小结 70
思考题与习题 70
参考文献 72
第4章 频繁模式挖掘 73
4.1 频繁模式挖掘的基本概念 73
4.1.1 项与项集、事务、事务数据库 73
4.1.2 模式支持度与频繁模式 75
4.2 频繁项集挖掘 76
4.2.1 Apriori算法 76
4.2.2 FP-Growth算法 78
4.2.3 垂直数据结构算法 84
4.2.4 模式压缩 86
4.3 关联规则挖掘 90
4.3.1 关联规则的产生 90
4.3.2 关联规则的评估 92
4.4 序列模式挖掘 96
4.4.1 序列模式挖掘的基本概念 97
4.4.2 PrefixSpan算法 97
本章小结 100
思考题与习题 100
参考文献 102
第5章 聚类分析 104
5.1 聚类分析的基本概念 104
5.1.1 聚类分析的概念与作用 104
5.1.2 聚类算法的性能要求 106
5.2 划分聚类方法 107
5.2.1 K-means算法 108
5.2.2 K-means++算法 111
5.2.3 K-medoids算法 114
5.3 层次聚类方法 118
5.3.1 算法的距离度量方法 119
5.3.2 凝聚的与分裂的层次聚类 120
5.4 基于密度的聚类方法 125
5.5 聚类分析性能评估 131
5.6 实例 133
本章小结 137
思考题与习题 137
参考文献 139
第6章 分类分析 140
6.1 分类分析的基本概念 140
6.1.1 分类分析的基本原理 141
6.1.2 主要分类方法 141
6.2 决策树 142
6.2.1 决策树的基本原理 142
6.2.2 属性选择度量 145
6.2.3 树剪枝 147
6.2.4 决策树算法 148
6.3 支持向量机 154
6.3.1 支持向量机的基本原理 154
6.3.2 支持向量机求解 157
6.4 人工神经网络 160
6.4.1 人工神经网络拓扑 160
6.4.2 反向传播过程 161
6.5 贝叶斯分类 166
6.5.1 贝叶斯分类的基本原理 166
6.5.2 朴素贝叶斯分类 167
6.6 分类模型的评价与选择 170
6.6.1 分类器的评价方法 170
6.6.2 分类器的评价指标 171
6.6.3 分类器的选择方法 174
6.7 组合分类技术 176
6.7.1 组合分类方法简介 177
6.7.2 装袋算法 177
6.7.3 提升算法 178
6.8 实例 180
本章小结 184
思考题与习题 184
参考文献 187
第7章 回归分析 189
7.1 回归分析的基本概念 189
7.1.1 导引 189
7.1.2 回归分析的主要步骤 190
7.2 线性回归 194
7.2.1 线性回归模型 194
7.2.2 最小二乘估计 194
7.2.3 加权最小二乘估计 197
7.2.4 极大似然估计 198
7.3 高维回归系数压缩 200
7.3.1 共线性的来源及影响 200
7.3.2 岭回归 202
7.3.3 LASSO回归 205
7.3.4 主成分回归 206
7.3.5 偏最小二乘回归 207
7.4 非线性回归 208
7.4.1 非线性回归模型 208
7.4.2 非线性最小二乘 209
7.4.3 支持向量回归 211
7.5 回归模型的评估 214
7.5.1 残差分析 214
7.5.2 拟合效果度量 216
本章小结 217
思考题与习题 217
参考文献 218
第8章 工业应用实例 220
8.1 高炉炼铁基本原理 220
8.1.1 高炉炼铁的背景与工艺原理 221
8.1.2 高炉操作对高炉状态的影响 222
8.1.3 所使用高炉相关数据介绍 222
8.2 高炉数据预处理 224
8.2.1 高炉数据特性分析 224
8.2.2 高炉数据去噪处理 224
8.2.3 高炉数据规范化 226
8.3 高炉参数的相关性分析 226
8.3.1 高炉操作参数间的相关性分析 226
8.3.2 高炉操作参数与状态参数间的相关性分析 227
8.3.3 高炉参数的自相关性分析 227
8.4 高炉操作参数状态聚类与炉况划分 228
8.5 基于分类分析的异常炉况诊断 231
8.6 高炉煤气利用率拟合与预测 233
8.6.1 最小二乘回归分析 233
8.6.2 支持向量回归分析 234
本章小结 238
参考文献 238