数据挖掘与R语言(原书第2版) / 数据科学与工程技术丛书
¥99.00定价
作者: [葡]路易斯·托尔戈;李洪成,潘文捷译
译者:李洪成、潘文捷 译;
出版时间:2018-05
出版社:机械工业出版社
- 机械工业出版社
- 9787111596660
- 2版
- 227178
- 44219505-3
- 16开
- 2018-05
- 383
- 348
- 工学
- 计算机科学与技术
- TP312R;TP311.13
- 计算机通信类
- 本科
内容简介
本书不要求读者具有R语言、数据挖掘或者统计技术的基础,它选择了多种案例问题,这些案例具有数据大小、数据类型、分析目标和分析工具等各方面的挑战。作者用一系列详细的实际案例以实践的方式来讲述数据挖掘的主要过程和技巧。在每个案例学习中,都包含必要的步骤、代码和数据。
目录
推荐序
中文版序
译者序
前言
致谢
1章 简介 1
1.1 如何阅读本书 2
1.2 重现性 2
一部分 R与数据挖掘简介
2章 R简介 6
2.1 R起步 6
2.2 与R控制台的简单交互 8
2.3 R对象和变量 9
2.4 R函数 11
2.5 向量 14
2.6 向量化 15
2.7 因子 16
2.8 生成序列 18
2.9 数据子集 20
2.10 矩阵和数组 22
2.11 列表 25
2.12 数据框 28
2.13 数据框的扩展 31
2.14 对象、类和方法 34
2.15 管理R会话 35
3章 数据挖掘简介 37
3.1 数据挖掘鸟瞰图 37
3.2 数据收集和业务理解 38
3.2.1 数据和数据集 39
3.2.2 导入数据到R 40
3.3 数据预处理 45
3.3.1 数据清洗 45
3.3.2 变换变量 53
3.3.3 生成变量 55
3.3.4 降维 66
3.4 建模 74
3.4.1 探索性数据分析 75
3.4.2 使用关联规则的依赖建模 94
3.4.3 聚类 101
3.4.4 异常检测 112
3.4.5 预测分析 120
3.5 评估 147
3.5.1 Holdout和随机子抽样 148
3.5.2 交叉验证 150
3.5.3 Bootstrap估计 153
3.5.4 推荐程序 154
3.6 报告和部署 155
3.6.1 通过动态文档进行报告 155
3.6.2 通过Web应用程序进行部署 158
二部分 数据挖掘案例研究
4章 预测海藻数量 164
4.1 问题描述与目标 164
4.2 数据说明 164
4.3 加载数据到R 165
4.4 数据可视化和总结 167
4.5 数据缺失 173
4.5.1 将缺失部分剔除 173
4.5.2 尝试找到缺失值有可能的赋值 175
4.5.3 通过变量的相关关系填补缺失值 176
中文版序
译者序
前言
致谢
1章 简介 1
1.1 如何阅读本书 2
1.2 重现性 2
一部分 R与数据挖掘简介
2章 R简介 6
2.1 R起步 6
2.2 与R控制台的简单交互 8
2.3 R对象和变量 9
2.4 R函数 11
2.5 向量 14
2.6 向量化 15
2.7 因子 16
2.8 生成序列 18
2.9 数据子集 20
2.10 矩阵和数组 22
2.11 列表 25
2.12 数据框 28
2.13 数据框的扩展 31
2.14 对象、类和方法 34
2.15 管理R会话 35
3章 数据挖掘简介 37
3.1 数据挖掘鸟瞰图 37
3.2 数据收集和业务理解 38
3.2.1 数据和数据集 39
3.2.2 导入数据到R 40
3.3 数据预处理 45
3.3.1 数据清洗 45
3.3.2 变换变量 53
3.3.3 生成变量 55
3.3.4 降维 66
3.4 建模 74
3.4.1 探索性数据分析 75
3.4.2 使用关联规则的依赖建模 94
3.4.3 聚类 101
3.4.4 异常检测 112
3.4.5 预测分析 120
3.5 评估 147
3.5.1 Holdout和随机子抽样 148
3.5.2 交叉验证 150
3.5.3 Bootstrap估计 153
3.5.4 推荐程序 154
3.6 报告和部署 155
3.6.1 通过动态文档进行报告 155
3.6.2 通过Web应用程序进行部署 158
二部分 数据挖掘案例研究
4章 预测海藻数量 164
4.1 问题描述与目标 164
4.2 数据说明 164
4.3 加载数据到R 165
4.4 数据可视化和总结 167
4.5 数据缺失 173
4.5.1 将缺失部分剔除 173
4.5.2 尝试找到缺失值有可能的赋值 175
4.5.3 通过变量的相关关系填补缺失值 176