- 机械工业出版社
- 9787111646396
- 1-2
- 319435
- 46257910-3
- 平装
- 16开
- 2020-04
- 534
- 320
- 工学
- 计算机科学与技术
- 数据科学与大数据技术
- 本科
内容简介
本书以数据挖掘项目的典型开发过程为线索,对数据挖掘的生命周期中的各个环节,以及其中所涉及的概念、方法、技术和过程模型进行了全面细致的介绍。对于数据挖掘核心部分的典型基础算法,通过细致的阐述、详尽的示例和充分的讨论,深入地展示了数据挖掘算法的内涵,以便读者认知、学习和掌握。
本书系统地介绍了数据挖掘原理、算法和应用的相关知识,内容覆盖数据挖掘的整个过程:数据采集、数据预处理、数据分类分析、数据聚类分析、数据关联分析和数据挖掘系统的应用等。在内容安排上通过数据挖掘的典型应用方法,将理论知识和工程技术应用有机地结合,浅显易懂且实践性强。
本书可以作为高等院校计算机科学与技术、信息管理、数据分析等专业的教科书,也可作为企业管理、信息分析人员的技术参考书籍。
本书配有电子课件,及与书中例题、作业题配套的数据素材,欢迎选用本书作教材的老师发邮件到jinacmp@索取,或登录注册下载。
本书系统地介绍了数据挖掘原理、算法和应用的相关知识,内容覆盖数据挖掘的整个过程:数据采集、数据预处理、数据分类分析、数据聚类分析、数据关联分析和数据挖掘系统的应用等。在内容安排上通过数据挖掘的典型应用方法,将理论知识和工程技术应用有机地结合,浅显易懂且实践性强。
本书可以作为高等院校计算机科学与技术、信息管理、数据分析等专业的教科书,也可作为企业管理、信息分析人员的技术参考书籍。
本书配有电子课件,及与书中例题、作业题配套的数据素材,欢迎选用本书作教材的老师发邮件到jinacmp@索取,或登录注册下载。
目录
目 录
前 言
第1章 绪论1
1.1 信息爆炸与大数据1
1.2 什么是数据挖掘5
1.3 数据挖掘的任务6
1.4 数据挖掘的应用7
1.5 数据挖掘系统结构9
1.6 数据挖掘面临的挑战9
1.7 数据挖掘样例数据和相关资料10
思考与练习13
参考文献13
第2章 数据挖掘的过程14
2.1 数据分析能力14
2.2 数据挖掘的过程16
2.3 三阶段过程模型17
2.4 SEMMA方法19
2.5 CRISP-DM过程模型21
2.6 5A模型25
2.7 模型融合26
本章小结26
思考与练习27
参考文献27
第3章 数据准备28
3.1 数据收集28
3.2 数据抽样29
3.3 数据集成32
3.4 数据清理39
3.5 数据归约43
3.6 数据变换48
本章小结50
思考与练习51
参考文献51
第4章 数据探索52
4.1 数据探索的作用52
4.2 数据可视化54
4.3 数据统计分析70
4.4 加载Excel插件78
本章小结79
思考与练习79
参考文献79
第5章 关联分析81
5.1 关联分析原理81
5.2 由候选项集产生频繁项集84
5.3 计算支持度计数94
5.4 FP-Growth算法98
5.5 产生频繁项集算法复杂度105
5.6 生成规则106
5.7 关联规则的评估111
本章小结116
思考与练习116
参考文献118
第6章 分类预测119
6.1 分类的原理119
6.2 决策树分类122
6.3 基于规则的分类器151
6.4 贝叶斯分类器156
6.5 人工神经网络173
6.6 支持向量机186
6.7 模型评估192
本章小结197
思考与练习197
参考文献198
第7章 聚类分析199
7.1 聚类的基本概念200
7.2 K均值(K-means)聚类方法208
7.3 K中心点(K-medoids)算法215
7.4 层次聚类216
7.5 DBSCAN聚类222
7.6 聚类算法评估228
本章小结232
思考与练习232
参考文献233
第8章 回归分析234
8.1 回归分析的概念234
8.2 回归算法235
8.3 回归的评估与检验244
本章小结249
思考与练习249
参考文献251
第9章 数据挖掘的工具252
9.1 MATLAB252
9.2 SPSS Modeler253
9.3 SAS Enterprise Miner254
9.4 WEKA255
9.5 R256
本章小结256
参考文献257
第10章 WEKA数据挖掘应用258
10.1 WEKA简介258
10.2 Explorer261
10.3 Experimenter302
10.4 KnowledgeFlow304
10.5 WEKA API310
10.6 WEKA的设置和使用311
本章小结313
思考与练习313
参考文献313
前 言
第1章 绪论1
1.1 信息爆炸与大数据1
1.2 什么是数据挖掘5
1.3 数据挖掘的任务6
1.4 数据挖掘的应用7
1.5 数据挖掘系统结构9
1.6 数据挖掘面临的挑战9
1.7 数据挖掘样例数据和相关资料10
思考与练习13
参考文献13
第2章 数据挖掘的过程14
2.1 数据分析能力14
2.2 数据挖掘的过程16
2.3 三阶段过程模型17
2.4 SEMMA方法19
2.5 CRISP-DM过程模型21
2.6 5A模型25
2.7 模型融合26
本章小结26
思考与练习27
参考文献27
第3章 数据准备28
3.1 数据收集28
3.2 数据抽样29
3.3 数据集成32
3.4 数据清理39
3.5 数据归约43
3.6 数据变换48
本章小结50
思考与练习51
参考文献51
第4章 数据探索52
4.1 数据探索的作用52
4.2 数据可视化54
4.3 数据统计分析70
4.4 加载Excel插件78
本章小结79
思考与练习79
参考文献79
第5章 关联分析81
5.1 关联分析原理81
5.2 由候选项集产生频繁项集84
5.3 计算支持度计数94
5.4 FP-Growth算法98
5.5 产生频繁项集算法复杂度105
5.6 生成规则106
5.7 关联规则的评估111
本章小结116
思考与练习116
参考文献118
第6章 分类预测119
6.1 分类的原理119
6.2 决策树分类122
6.3 基于规则的分类器151
6.4 贝叶斯分类器156
6.5 人工神经网络173
6.6 支持向量机186
6.7 模型评估192
本章小结197
思考与练习197
参考文献198
第7章 聚类分析199
7.1 聚类的基本概念200
7.2 K均值(K-means)聚类方法208
7.3 K中心点(K-medoids)算法215
7.4 层次聚类216
7.5 DBSCAN聚类222
7.6 聚类算法评估228
本章小结232
思考与练习232
参考文献233
第8章 回归分析234
8.1 回归分析的概念234
8.2 回归算法235
8.3 回归的评估与检验244
本章小结249
思考与练习249
参考文献251
第9章 数据挖掘的工具252
9.1 MATLAB252
9.2 SPSS Modeler253
9.3 SAS Enterprise Miner254
9.4 WEKA255
9.5 R256
本章小结256
参考文献257
第10章 WEKA数据挖掘应用258
10.1 WEKA简介258
10.2 Explorer261
10.3 Experimenter302
10.4 KnowledgeFlow304
10.5 WEKA API310
10.6 WEKA的设置和使用311
本章小结313
思考与练习313
参考文献313