- 电子工业出版社
- 9787121384004
- 1-7
- 349689
- 48253271-0
- 平塑
- 16开
- 2024-07
- 461
- 288
- 工学
- 计算机科学与技术
- 计算机科学与技术
- 本科 研究生及以上
作者简介
目录
大数据理论模块__eol__第1章 大数据理论 2__eol__1.1 大数据的概念 2__eol__1.1.1 大数据的定义 2__eol__1.1.2 大数据的本质 2__eol__1.1.3 大数据的分类 3__eol__1.1.4 大数据的特征 5__eol__1.1.5 大数据的功能 6__eol__1.1.6 大数据处理的基本流程 6__eol__1.2 大数据的发展 7__eol__1.2.1 大数据的发展现状 7__eol__1.2.2 大数据的发展趋势 7__eol__1.3 大数据的应用 8__eol__1.3.1 企业内部大数据 8__eol__1.3.2 在线社交网络大数据 8__eol__1.3.3 健康医疗大数据 9__eol__1.3.4 金融大数据 9__eol__1.4 常用的数据挖掘工具 10__eol__1.4.1 Tableau 10__eol__1.4.2 Excel 10__eol__1.4.3 SPSS Modeler 11__eol__数据分析与挖掘模块__eol__第2章 SPSS Modeler软件 14__eol__2.1 SPSS Modeler 软件概述 14__eol__2.1.1 SPSS Modeler界面 14__eol__2.1.2 数据流的基本管理和执行 16__eol__2.1.3 数据流的其他管理 18__eol__2.1.4 SPSS Modeler应用案例 20__eol__2.2 SPSS Modeler数据的读入 25__eol__2.2.1 变量的类型 25__eol__2.2.2 读数据 26__eol__2.2.3 生成实验方案数据 32__eol__2.2.4 数据合并 34__eol__2.3 SPSS Modeler数据的基本分析 38__eol__2.3.1 数据质量 38__eol__2.3.2 基本描述分析 44__eol__2.3.3 变量分布探索 47__eol__2.3.4 二分类型变量相关性研究 49__eol__2.3.5 两总体的平均值比较 56__eol__2.3.6 变量的重要性分析 62__eol__第3章 数据清洗 67__eol__3.1 数据清洗概述 67__eol__3.1.1 数据清洗的概念 67__eol__3.1.2 数据清洗的对象 67__eol__3.1.3 数据清洗的一般步骤 68__eol__3.1.4 数据清洗的常用方式 69__eol__3.1.5 数据清洗的基本方法 69__eol__3.2 Excel数据清洗的基本操作 70__eol__3.2.1 重复值的处理 70__eol__3.2.2 缺失值及异常值的处理 74__eol__3.3 Excel数据加工的基本操作 78__eol__3.3.1 字段分列 78__eol__3.3.2 字段合并 79__eol__3.3.3 字段匹配 80__eol__3.3.4 数据分组 81__eol__3.4 Excel数据透视表 81__eol__3.4.1 数据透视表应用 81__eol__3.4.2 数据透视表的实用技巧 85__eol__第4章 时间序列分析 89__eol__4.1 时间序列 89__eol__4.1.1 时间序列概述 89__eol__4.1.2 时间序列的预测步骤 90__eol__4.2 移动平均法 90__eol__4.2.1 一次移动平均法 91__eol__4.2.2 二次移动平均法 94__eol__4.3 指数平滑法 96__eol__4.3.1 一次指数平滑法 97__eol__4.3.2 二次指数平滑法 98__eol__4.3.3 三次指数平滑法 104__eol__第5章 分类预测:决策树 110__eol__5.1 决策树概述 110__eol__5.1.1 什么是决策树 110__eol__5.1.2 决策树的几何理解 111__eol__5.1.3 决策树的核心问题 111__eol__5.2 SPSS Modeler中的C5.0算法及应用 113__eol__5.2.1 C5.0决策树的分割点 113__eol__5.2.2 C5.0决策树的剪枝过程 114__eol__5.2.3 C5.0决策树的推理规则集 115__eol__5.2.4 C5.0决策树的应用 116__eol__5.3 SPSS Modeler中的C&RT算法及应用 123__eol__5.3.1 C&RT的生长过程 124__eol__5.3.2 C&RT的剪枝过程 125__eol__5.3.3 C&RT的应用 127__eol__5.4 SPSS Modeler中的CHAID算法及应用 129__eol__5.4.1 CHAID算法的最佳分组变量 130__eol__5.4.2 CHAID算法的剪枝过程 130__eol__5.4.3 Exhaustive CHAID算法 131__eol__5.4.4 CHAID算法的应用 131__eol__5.5 SPSS Modeler中的QUEST算法及应用 132__eol__5.5.1 QUEST算法的最佳分割点 132__eol__5.5.2 QUEST算法的应用 133__eol__5.6 决策树算法的评估和注意事项 134__eol__第6章 分类预测:人工神经网络 143__eol__6.1 人工神经网络概述 143__eol__6.1.1 人工神经网络的概念和种类 143__eol__6.1.2 人工神经网络中的节点 145__eol__6.1.3 建立人工神经网络的一般步骤 147__eol__6.2 SPSS Modeler中的B-P反向传播网络 149__eol__6.2.1 感知器模型 149__eol__6.2.2 B-P反向传播网络 152__eol__6.2.3 B-P反向传播算法 154__eol__6.2.4 B-P反向传播网络的建立 156__eol__6.3 SPSS Modeler中的径向基函数网络 159__eol__6.3.1 径向基函数网络 159__eol__6.3.2 径向基函数网络中的隐藏层节点和输出节点 160__eol__6.3.3 径向基函数网络的学习过程 161__eol__6.4 人工神经网络的应用 162__eol__第7章 分类预测:Logistic回归分析 176__eol__7.1 二项Logistic回归方程 176__eol__7.1.1 二项Logistic回归方程概述 176__eol__7.1.2 二项Logistic回归方程中系数的含义 178__eol__7.2 二项Logistic回归分析的应用 180__eol__7.3 多项Logistic回归分析的应用 184__eol__第8章 关联分析 185__eol__8.1 简单关联规则分析 185__eol__8.1.1 简单关联规则的基本概念 186__eol__8.1.2 简单关联规则的有效性和实用性 187__eol__8.2 Apriori算法 190__eol__8.2.1 寻找频繁项集 190__eol__8.2.2 依据频繁项集产生简单关联规则 192__eol__8.3 Apriori算法的应用 193__eol__8.4 序列关联规则分析 200__eol__8.4.1 序列关联规则的基本概念 200__eol__8.4.2 序列关联规则的时间约束 201__eol__8.5 Sequence算法 202__eol__8.5.1 产生频繁序列集 202__eol__8.5.2 依据频繁序列集生成序列关联规则 203__eol__8.6 Sequence算法的应用 204__eol__第9章 聚类分析 208__eol__9.1 聚类分析概述 208__eol__9.2 K-Means聚类算法及应用 209__eol__9.2.1 K-Means聚类算法对“亲疏程度”的衡量 209__eol__9.2.2 K-Means聚类过程 209__eol__9.2.3 K-Means聚类算法的应用 211__eol__9.3 两步聚类算法及应用 219__eol__9.3.1 两步聚类算法对“亲疏程度”的衡量 219__eol__9.3.2 两步聚类过程 220__eol__9.3.3 两步聚类算法的应用 222__eol__9.4 Kohonen网络聚类算法及应用 224__eol__9.4.1 Kohonen网络聚类算法的原理 224__eol__9.4.2 Kohonen网络聚类过程 225__eol__9.4.3 Kohonen网络聚类算法的应用 227__eol__9.5 基于聚类分析的离群值探索及应用 230__eol__9.5.1 多维空间基于聚类的诊断方法 230__eol__9.5.2 多维空间基于聚类的诊断方法的应用 232__eol__数据可视化模块__eol__第10章 数据可视化 238__eol__10.1 数据可视化入门 238__eol__10.1.1 i2 Analyst’s Notebook 8软件 238__eol__