注册 登录 进入教材巡展
#

出版时间:2020-01

出版社:北京师范大学出版社

以下为《R语言大数据技术应用实践》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 北京师范大学出版社
  • 9787303247639
  • 1版
  • 284123
  • 48258739-1
  • 平装
  • 16开
  • 2020-01
  • 352
  • 工学
  • 软件工程
  • 计算机、大数据
  • 本科
作者简介
女,中共党员,东华大学工学博士,美国加州大学洛杉矶分校高级访问学者、美国劳伦斯理工大学访问学者,中国人工智能学会智能服务专委会委员、中国自动化学会会员,副教授、硕士生导师。目前聘任上海工程技术大学电子电气工程学院副院长。
近三年主持国家自然科学基金青年基金项目、上海市高教学会项目、松江区科委软课题项目各一项、企业委托项目多项,参与国家自然科学基金青年基金项目一项。在国内外刊物上发表论文30余篇,授权发明专利2项,主编教材2本。
查看全部
内容简介

本书以大数据技术中数据统计分析的经典实现方法R语言应用实践为核心,以提高学生的大数据基础理论水平和解决实践问题的能力为出发点,以培养大数据时代具有创新精神和实践能力的人才为目的。


本书系统阐述R语言大数据技术应用实践的原理、方法和应用相关知识,同时给出了每一章内容对应的实现指令或源程序。全书共九章内容。内容由浅入深,分为基础篇及提高篇两部分,其中第1章到第6章为基础篇,第7章到第9章为提升篇。内容涵盖R语言基础简介、R语言语法基础、R语言数据预处理、R语言数据分析、R语言数据可视化、R语言网络数据抓取、R语言统计与建模、R语言数据挖掘、R语言数据分析综合案例等较深入的知识。本书理论结合实际,每一个章节都包含有相关内容的实践部分,以便读者在了解相关知识后,能及时进行项目的实践,有助于提高读者动手实践的能力。每章提供适量习题,进一步加深对内容的理解。


本书内容全面,详略得当,在简单阐述原理基础上,重点阐述R语言应用实践的详细实现过程,可读性强。本书可以作为高等院校大数据技术相关专业以及计算机技术、信息管理、人工智能、电子信息工程、通信工程、自动控制等专业本科生及高职院校相关课程的教材,也可供从事大数据相关研究的技术人员参考。



目录
内 容 简 介 2
前  言 3
序 4
目  录 5
第1章  R语言基础简介 11
1.1  R语言概述 11
1.2  为何学习R语言 11
1.2.1  R语言特点 11
1.2.2  R在大数据中的优势 12
1.3  R语言主要应用领域 13
1.4  R语言开发环境搭建 14
1.4.1  Windows系统中安装R 14
1.4.2  Linux系统中安装R 14
1.4.3  RStudio工具安装与使用 15
本章习题 16
第2章  R语言语法基础 18
2.1  R语言数据类型 18
2.1.1  R的4种数据类型 18
2.1.2  字符型的高级技巧 20
2.1.3  NA和NULL 21
2.2  R语言数据结构 22
2.2.1  Array数组 22
2.2.2  Factor因子 23
2.2.3  List列表 25
2.2.4  DataFrame数据框 26
2.3  R语言程序结构 28
2.3.1  三种基本结构 28
2.3.2  for循环 28
2.3.4  while循环 30
2.3.5  repeat循环 31
2.4  R语言向量化计算 32
2.4.1  向量化计算的概念 32
2.4.2  冒号运算符 32
2.4.3  序列生成函数seq和rep 32
2.4.4  数组之间的运算规则 33
2.5  强大的apply函数族 34
2.5.1  apply 34
2.5.2  lapply 35
2.5.3  sapply 35
2.5.4  vapply 36
2.5.5  mapply 37
2.5.6  tapply 37
本章习题 38
第3章  R语言数据预处理 40
3.1  数据导入导出 40
3.1.1  R语言数据导入 40
3.1.2  导入函数参数匹配 47
3.1.3  R语言数据导出 48
3.2  R语言数据处理方法 49
3.2.1  重复值处理 50
3.2.2  缺失值处理 50
3.2.3  空格值处理 52
3.2.4  字段抽取 53
3.2.5  记录抽取 54
3.2.6  随机抽样 54
3.2.7  记录合并 55
3.2.8  字段匹配 57
3.2.9  生成新的字段 58
3.2.10  数据标准化 59
3.2.11  数据分组 60
3.2.12  日期格式处理 62
3.2.13  日期抽取 63
3.2.14  变量重命名 63
本章习题 64
第4章  R语言数据分析 66
4.1  基本统计分析 66
4.1.1  基本概念 66
4.1.2  基本统计的应用 66
4.2  对比分析 67
4.2.1  基本概念 67
4.2.2  对比分析的应用 68
4.3  分组分析 71
4.3.1  基本概念 71
4.3.2  分组分析的应用 72
4.4  分布分析 72
4.4.1  基本概念 72
4.4.2  分布分析的应用 73
4.5  交叉分析 75
4.5.1  基本概念 75
4.5.2  交叉分析的应用 75
4.6  结构分析 76
4.6.1  基本概念 76
4.6.2  结构分析的应用 76
4.7  相关分析 79
4.7.1  基本概念 79
4.7.2  相关分析的应用 80
4.8  简单线性回归分析 81
4.8.1  基本概念 81
4.8.2  简单线性回归分析的应用 82
4.9  多重线性回归分析 84
4.9.1  基本概念 84
4.9.2  多重线性回归分析的应用 85
4.10  RFM分析 87
4.10.1  基本概念 87
4.10.2  RFM分析的应用 87
本章习题 90
第5章  R语言数据可视化 92
5.1  R语言可视化概述 92
5.2  饼图 92
5.2.1  饼图的概念 92
5.2.2  饼图的使用 93
5.3  散点图 95
5.3.1  散点图的概念 95
5.3.2  散点图的使用 96
5.4  折线图 100
5.4.1  折线图的概念 100
5.4.2  折线图的使用 102
5.5  柱形图 107
5.5.1  柱形图的概念 107
5.5.2  柱形图的使用 107
5.6  直方图 112
5.6.1  直方图的概念 112
5.6.2  直方图的使用 113
5.7  箱线图 115
5.7.1  箱线图的概念 115
5.7.2  箱线图的使用 116
5.8  树图 118
5.8.1  树图的概念 118
5.8.2  树图的使用 118
5.9  地图 121
5.9.1  地图的概念 121
5.9.2  地图的使用 122
5.10  热力地图 125
5.10.1  热力地图的概念 125
5.10.2  热力地图的使用 126
本章习题 127
第6章  网页数据抓取 129
6.1  HTML数据抓取 129
6.1.1  查看HTML文件 129
6.1.2  解析hHTML文件内容 130
6.2  JSON数据抓取 131
6.2.1  查看JSON文件 131
6.2.2  获取JSON文件内容 133
6.3  使用Google开发者工具分析网页结构 134
6.3.1  Google开发者工具的功能介绍 134
6.3.2  利用Network标签抓取数 135
本章习题 136
第7章  R语言统计与建模 137
7.1  R语言常用概率分布和渐进性 137
7.1.1  伯努利分布 137
7.1.2  二项分布 138
7.1.3  正态分布 141
7.1.4  泊松分布 145
7.1.5  渐进性 147
7.2  R语言置信区间和假设检验 149
7.2.1  置信区间和假设检验的概念 149
7.2.2  置信区间和假设检验的应用 155
7.3  R语言一元线性回归建模 159
7.3.1  一元线性回归分析的基本概念 159
7.3.2  一元线性回归模型 160
7.3.3  一元残差分析 161
7.3.4  一元线性回归应用 161
7.4  R语言多元线性回归建模 168
7.4.1  多元线性回归模型的概念 168
7.4.2  多元线性回归模型的结构 168
7.4.3  单元残差分析 168
7.4.4  变量选择和逐步回归 170
7.4.5  多元线性回归应用 170
7.5  R语言广义线性回归建模 176
7.5.1  广义线性回归模型 176
7.5.2  广义线性回归应用 177
本章习题 181
第8章  R语言数据挖掘 183
8.1   数据挖掘简介 183
8.1.1  数据挖掘的基本概念 183
8.1.2  数据挖掘的算法 184
8.1.3  数据挖掘的工具 187
8.1.4  R在数据挖掘中的优势 189
8.2  数据挖掘的四大应用场景 189
8.2.1  数据预测 190
8.2.2  发现数据的内在结构 191
8.2.3  发现关联性 192
8.2.4  模式甄别 194
8.3  数据挖掘流程 195
8.3.1  数据挖掘的三个主要阶段 195
8.3.2  数据挖掘解决问题的思想 197
8.4  分类预测基本流程 199
8.4.1  分类预测的基本流程和要素 199
8.4.2  分类预测错误和模型评价指标 200
8.4.3  分类预测模型案例 201
8.5  数据挖掘中的数据预处理 209
8.5.1  数据清洗 209
8.5.2  数据集成 213
8.5.3  数据变换 217
8.5.4  数据规约 226
8.6  R语言决策树分类方法 231
8.6.1  决策树算法介绍 232
8.6.2  随机森林算法介绍 234
8.6.3  决策树分类方法的应用 234
8.7  R语言高级分类方法 243
8.7.1  基于模型的分类算法 243
8.7.2  线性判别分析 243
8.7.3  朴素贝叶斯 244
8.7.4  bagging算法 245
8.7.5  boosting算法 245
8.7.6  高级分类方法的应用 245
8.8  R语言聚类分析与关联分析 252
8.8.1  KMeans聚类概念 252
8.8.2  分层聚类概念 253
8.8.3  聚类分析的应用 253
8.8.4  关联规则基本概念 256
8.8.5  关联分析的应用 257
8.9  智能推荐 263
8.9.1  智能推荐模型构建 263
8.9.2  智能推荐模型评价 269
8.10  时间序列挖掘 273
8.10.1  ARIMA模型 273
8.10.2  其他时间序列模型 279
8.11  离群点检测 286
8.11.1  离群点及其检测方法 286
8.11.2  离群点检验应用 293
本章习题 297
第9章  R语言数据分析综合应用 299
9.1  建立营销响应的模型 299
9.1.1  实验介绍 299
9.1.2  相关工具包 299
9.1.3  探索性数据分析和预处理 301
9.1.4  建立分类模型 305
9.2  预测销售额 307
9.2.1  实验介绍 307
9.2.2  相关工具包 308
9.2.3  探索性数据分析和预处理 309
9.2.4  查看竞争门店的各种信息 321
9.2.5  建立回归模型 328
9.3  水质评估 331
9.3.1  实验介绍 331
9.3.2  数据预处理 332
9.3.3  模型构建 333
9.3.4  水质评价 336
9.4  财政收入分析预测模型 337
9.4.1  实验介绍 337
9.4.2  数据探索分析 338
9.4.3  模型构建 341
9.4.4  财政收入预测模型 342
本章习题 353
参考文献 355
附录 356
二.  习题参考答案 356