注册 登录 进入教材巡展
#

出版时间:2023-09

出版社:电子工业出版社

以下为《R语言大数据分析与挖掘》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 电子工业出版社
  • 9787121452383
  • 1-2
  • 512238
  • 48253794-1
  • 平塑勒
  • 16开
  • 2023-09
  • 448
  • 280
  • 管理科学与工程
  • 本科 高职
内容简介
本书首先简要介绍了大数据分析与挖掘的相关概念,以及R语言的基础知识,以此来帮助读者了解、使用R语言;其次详细介绍了探索性数据分析、数据采集,以此来帮助读者了解数据的基本分析方法和数据的获取方法;然后着重介绍了目前主流的数据挖掘算法——时间序列算法、线性回归算法、分类算法、关联算法、聚类算法,从算法的原理到如何使用R语言进行算法实现都进行了详细的介绍并提供了实操代码,以此帮助读者学习数据挖掘及使用R语言完成数据挖掘任务;最后通过6个旅游行业的实际案例来帮助读者将学习到的知识运用到真实的业务场景中,并融会贯通整个知识体系。 本书无须读者具备R语言和大数据分析与挖掘的基础知识。无论是R语言初学者,还是熟练的R语言用户,都能从本书中找到有用的内容。本书既可以作为一本学习R语言的教材,也可以作为大数据分析与挖掘的工具书。
目录
第1章 大数据分析与挖掘概论 1__eol__1.1 大数据分析与挖掘 1__eol__1.1.1 大数据定义 1__eol__1.1.2 大数据分析与挖掘的概念 2__eol__1.2 大数据分析与挖掘流程 3__eol__1.2.1 数据获取 3__eol__1.2.2 数据预处理 3__eol__1.2.3 数据分析 4__eol__1.2.4 数据解释 5__eol__1.3 大数据分析与挖掘应用 5__eol__1.3.1 优化任务 5__eol__1.3.2 预测任务 5__eol__1.3.3 分类任务 5__eol__1.3.4 识别任务 6__eol__第2章 R语言编程基础 7__eol__2.1 R语言的安装及配置 7__eol__2.1.1 R语言的获取和安装 8__eol__2.1.2 RStudio的获取和安装 9__eol__2.2 界面与菜单 12__eol__2.2.1 RGui界面 12__eol__2.2.2 RStudio界面 12__eol__2.3 变量与数据类型 15__eol__2.3.1 变量 15__eol__2.3.2 数据类型 15__eol__2.4 数据结构 17__eol__2.4.1 向量 17__eol__2.4.2 数组 19__eol__2.4.3 矩阵 21__eol__2.4.4 列表 22__eol__2.4.5 数据框 23__eol__2.4.6 因子 25__eol__2.5 控制语句 26__eol__2.5.1 条件语句 26__eol__2.5.2 循环语句 28__eol__2.6 函数 30__eol__2.6.1 内置函数 30__eol__2.6.2 自定义函数 33__eol__第3章 数据预处理 35__eol__3.1 数据表的基本操作 35__eol__3.1.1 数据表保存 35__eol__3.1.2 数据表读取 37__eol__3.1.3 选取子集 40__eol__3.1.4 连接数据库 42__eol__3.2 数据分组、分割、合并和变形 44__eol__3.2.1 数据分组 44__eol__3.2.2 数据分割 46__eol__3.2.3 数据合并 47__eol__3.2.4 数据变形 49__eol__3.3 缺失值、异常值、重复值处理 52__eol__3.3.1 缺失值 52__eol__3.3.2 异常值 59__eol__3.3.3 重复值 61__eol__3.4 数据类型的转换 62__eol__3.4.1 判断数据类型函数 62__eol__3.4.2 转换数据类型的函数 63__eol__3.5 提取字符 64__eol__3.5.1 截取字符 64__eol__3.5.2 正则表达式 65__eol__第4章 探索性数据分析 69__eol__4.1 描述性统计方法 69__eol__4.1.1 常用统计指标 69__eol__4.1.2 数据总结 70__eol__4.2 数据可视化 72__eol__4.2.1 箱线图 72__eol__4.2.2 直方图 74__eol__4.2.3 散点图 75__eol__4.2.4 饼图 77__eol__第5章 数据采集 80__eol__5.1 网络数据采集的原理 80__eol__5.1.1 网页通信的过程 80__eol__5.1.2 请求数据的方法 87__eol__5.1.3 网页的组成元素 88__eol__5.2 数据采集入门 90__eol__5.2.1 数据采集常用包概述 90__eol__5.2.2 数据采集前的准备 91__eol__5.2.3 编写第一个数据采集 92__eol__5.3 使用常用的R包采集数据 96__eol__5.3.1 使用RCurl包获取网络数据 96__eol__5.3.2 使用rvest包获取网络数据 98__eol__5.3.3 使用httr包获取网络数据 106__eol__5.4 爬虫限制处理 107__eol__5.4.1 解决IP限制问题 108__eol__5.4.2 验证码处理 109__eol__5.4.3 登录问题处理 110__eol__第6章 时间序列算法 111__eol__6.1 时间序列算法概述 111__eol__6.1.1 时序对象 113__eol__6.1.2 时序平滑处理 113__eol__6.1.3 时序季节性分解 116__eol__6.2 时序指数模型 118__eol__6.3 时序ARIMA模型 122__eol__第7章 线性回归算法 129__eol__7.1 一元线性回归模型 129__eol__7.2 多项式回归模型 131__eol__7.3 多元线性回归模型 133__eol__第8章 分类算法 136__eol__8.1 Logistic回归 136__eol__8.1.1 Logistic回归算法原理 137__eol__8.1.2 逻辑回归算法应用 139__eol__8.2 决策树 143__eol__8.2.1 决策树算法原理 143__eol__8.2.2 决策树算法应用 147__eol__8.3 支持向量机 150__eol__8.3.1 支持向量机算法原理 151__eol__8.3.2 支持向量机算法应用 155__eol__8.4 朴素贝叶斯 157__eol__8.4.1 贝叶斯定理 157__eol__8.4.2 最大似然估计 157__eol__8.4.3 朴素贝叶斯分类算法原理 158__eol__8.4.4 朴素贝叶斯分类算法应用 159__eol__8.5 人工神经网络 166__eol__8.5.1 人工神经网络的基本概念 166__eol__8.5.2 感知器和人工神经元模型 167__eol__8.5.3 前馈神经网络 168__eol__8.5.4 人工神经网络算法应用 169__eol__8.6 随机森林 177__eol__8.6.1 随机森林算法原理 177__eol__8.6.2 随机森林算法应用 178__eol__8.7 XGBoost算法 183__eol__8.7.1 XGBoost算法的原理 184__eol__8.7.2 XGBoost算法应用 187__eol__第9章 关联算法 189__eol__9.1 关联算法概述 189__eol__9.1.1 相关名词 190__eol__9.1.2 关联规则及频繁项集的产生 190__eol__9.2 Apriori算法 191__eol__9.2.1 Apriori算法概述 191__eol__9.2.2 先验原理 191__eol__9.2.3 连接步和剪枝步 192__eol__9.2.4 Apriori算法流程 193__eol__9.2.5 Apriori算法实例 193__eol__9.3 ECLAT算法 196__eol__9.3.1 ECLAT算法概述 196__eol__9.3.2 ECLAT算法流程 198__eol__9.3.3 ECLAT算法实例 198__eol__第10章 聚类算法 202__eol__10.1 聚类算法概述 202__eol__10.1.1 聚类算法的类型 202__eol__10.1.2 聚类算法评估的特点 202__eol__10.2 K均值聚类算法 203__eol__10.2.1 划分方法概述 203__eol__10.2.2 K均值聚类算法的优缺点 203__eol__10.2.3 K均值聚类算法的流程 203__eol__10.2.4 K均值聚类分析案例 204__eol__10.3 凝聚式层次聚类算法 205__eol__10.3.1 凝聚式层次聚类概述 205__eol__10.3.2 凝聚式层次聚类算法流程 207__eol__10.3.3 凝聚式层次聚类算法实例 209__eol__【应用案例1】景点舆情数据采集 211__eol__【应用案例2】旅游电商平台数据采集 218__eol__【应用案例3】旅游网站景点路线推荐 233__eol__【应用案例4】旅游城市和景点的负荷预测 236__eol__【应用案例5】精品旅行服务成单预测 239__eol__【应用案例6】航班延误预测 259__eol__