注册 登录 进入教材巡展
#
  • #

出版时间:2017-06

出版社:机械工业出版社

以下为《数据科学:R语言实现》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111568315
  • 1版
  • 283909
  • 44219679-6
  • 平装
  • 16开
  • 2017-06
  • 485
  • 323
  • 工学
  • 软件工程
  • 计算机通信类
  • 本科
内容简介
本书通过简单直观的R代码、逐渐深入的讲解以及省时省力的方法,提供了大量数据分析样例,终帮助你高效地解决各类数据问题。第1章介绍了如何创建R函数,避免不必要的代码重复。你会学到如何借助R程序包在各种数据源上准备、处理和执行复杂的ETL操作。后面的章节介绍了财务数据的时间序列分析,同时还介绍了机器学习的几个热点,例如数据分类、回归、聚类、关联规则挖掘、降维等。本书的结尾中,你会学到如何解决实际问题,并能够在数据分析过程中轻松地给出解决方案。
目录
目  录推荐序译者序前言第1章 R中的函数11.1引言11.2 创建R函数21.3 匹配参数31.4 理解环境51.5 使用词法域81.6 理解闭包101.7 执行延迟计算121.8 创建中缀操作符131.9 使用替代函数151.10 处理函数中的错误171.11 调试函数21第2章 数据抽取、转换和加载282.1 引言282.2 下载公开数据282.3 读取和写入CSV文件312.4 扫描文本文件322.5 使用Excel文件342.6 从数据库中读取数据362.7 爬取网络数据382.8 获取Facebook数据442.9 使用twitteR49第3章 数据预处理和准备533.1 引言533.2 重命名数据变量533.3 转换数据类型553.4 使用日期格式573.5 添加新的记录583.6 过滤数据603.7 舍弃数据633.8 合并数据643.9 排列数据653.10 重塑数据673.11 检测缺失数据693.12 估计缺失数据71第4章 数据操作744.1 引言744.2 使用ble加强ame744.3 使用ble管理数据774.4 使用ble执行快速聚合824.5 使用ble合并大型数据集854.6 使用dplyr进行数据抽取和切片884.7 使用dplyr进行数据抽样914.8 使用dplyr选取列924.9 使用dplyr进行链式操作944.10 使用dplyr整理行954.11 使用dplyr消除重复行974.12 使用dplyr添加新列984.13 使用dplyr汇总数据994.14 使用dplyr合并数据102第5章 使用ggplot2可视化数据1055.1 引言1055.2 使用ggplot2创建基础图形1065.3 改变美学映射1095.4 引入几何对象1125.5 执行变换1165.6 调整图形尺度1185.7 分面1205.8 调整主题1225.9 组合图形1245.10 创建地图126第6章 制作交互式报告1316.1 引言1316.2 创建R Markdown报告1316.3 学习markdown语法1356.4 嵌入R代码块1376.5 使用ggvis创建交互式图形1406.6 理解基础语法1436.7 控制坐标轴和图例1486.8 使用尺度1536.9 给ggvis图形添加交互1546.10 创建R Shiny文档1596.11 发布R Shiny报告164第7章 概率分布模拟1697.1 引言1697.2 生成随机样本1697.3 理解均匀分布1717.4 生成二项随机变量1737.5 生成泊松随机变量1757.6 从正态分布中抽样1777.7 从卡方分布中抽样1837.8 理解学生t-分布1857.9 从数据集中抽样1877.10 模拟随机过程188第8章 R中的统计推断1918.1 引言1918.2 获取置信区间1918.3 执行Z-检验1968.4 执行学生T-检验1998.5 执行精确二项检验2028.6 执行Kolmogorov-Smirnov检验2038.7 使用Pearson卡方检验2058.8 理解Wilcoxon秩和检验2078.9 执行单因素方差分析2098.10 执行双因素方差分析212第9章 R语言规则和模式挖掘2169.1 引言2169.2 把数据转换为事务2169.3 展示事务和关联2189.4 使用Apriori规则挖掘关联关系2209.5 对冗余规则剪枝2239.6 可视化关联规则2249.7 使用Eclat挖掘频繁项集2269.8 使用时序信息创建事务2289.9 使用cSPADE挖掘频繁序列模式231第10章 R语言时间序列挖掘23510.1 引言23510.2 创建时间序列数据23510.3 绘制时间序列对象23810.4 分解时间序列24110.5 平滑时间序列24310.6 预测时间序列24710.7 选取ARIMA模型25110.8 创建ARIMA模型25510.9 使用ARIMA模型预测25710.10 使用ARIMA模型预测股票价格260第11章 监督式机器学习26411.1 引言26411.2 使用lm拟合线性回归模型26411.3 汇总线性模型拟合26611.4 使用线性回归来预测未知值26811.5 度量回归模型的性能27011.6 执行多元回归分析27211.7 使用逐步回归选取最优拟合回归模型27411.8 应用高斯模型泛化线性回归27611.9 执行逻辑斯谛回归分析27711.10 使用递归分割树构建分类模型28011.11 可视化递归分割树28211.12 使用混淆矩阵度量模型性能28311.13 使用ROCR度量预测性能285第12章 非监督式机器学习28812.1 引言28812.2 使用层次聚类法对数据聚类28812.3 切割树成聚类29112.4 使用k-means方法对数据聚类29312.5 使用基于密度的方法对数据聚类29412.6 从聚类中抽取轮廓信息29612.7 比较多种聚类方法29812.8 使用基于密度的聚类识别数字29912.9 使用k-means聚类方法分组相似文本文档30112.10 使用主成分分析法进行数据降维30312.11 使用陡坡图确定主成分数量30512.12 使用Kaiser方法确定主成分数量30612.13 使用双标图可视化多变元数据308