注册 登录 进入教材巡展
#

出版时间:2022-09-18

出版社:高等教育出版社

以下为《大数据技术基础》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 高等教育出版社
  • 9787040579628
  • 1版
  • 440671
  • 60250053-0
  • 16开
  • 2022-09-18
  • 400
  • 理学
  • 统计学
  • 管理类、大数据技术与应用
  • 本科
内容简介

本书系统、全面地介绍了大数据的概念、基本原理、平台技术和分析技术。

全书共分11章,分别为大数据概述、大数据系统生态、大数据存储与管理、计算与处理、数据获取技术、数据预处理、大数据分析技术、可视化展现以及《西游记》文本分析案例、旅游网站大数据分析案例、在线用户行为分析案例。

本书既可以满足大数据管理与应用、数据科学与大数据技术、计算机科学与技术、大数据技术与应用等多个专业老师、学生的教学与自学需要,也可作为大数据科学家、分析员及工程师的参考书。

目录

 前辅文
 第1章 大数据概述
  1.1 数据
  1.2 大数据的成因
   1.2.1 数据的产生
   1.2.2 信息的存储
   1.2.3 传输的技术
   1.2.4 信息的处理
  1.3 大数据的内涵与特征
   1.3.1 大数据的内涵
   1.3.2 大数据的特征
  1.4 大数据的结构类型
   1.4.1 结构化数据
   1.4.2 半结构化数据
   1.4.3 非结构化数据
  1.5 大数据时代的新理念
  1.6 大数据应用场景
  1.7 典型企业大数据解决方案
  1.8 大数据平台技术
  1.9 大数据分析技术
  关键术语
  本章小结
  即测即评
 第2章 大数据系统生态
  2.1 并行计算技术
   2.1.1 并行计算的思想
   2.1.2 高性能计算系统
   2.1.3 分布式计算系统
   2.1.4 并行计算的系统支持
  2.2 Hadoop 生态系统
   2.2.1 系统概述
   2.2.2 Hadoop 的核心组件
   2.2.3 Hadoop 的部署
  2.3 Spark 生态系统
   2.3.1 Spark 简介
   2.3.2 Spark 的核心组件
   2.3.3 Spark 的部署
  关键术语
  本章小结
  即测即评
 第3章 大数据存储与管理
  3.1 大数据物理存储
   3.1.1 物理存储技术
   3.1.2 网络化存储
   3.1.3 云存储和数据中心
  3.2 分布式文件系统
   3.2.1 概述
   3.2.2 HDFS 的概念
   3.2.3 HDFS 的工作原理
  3.3 NoSQL 数据库
   3.3.1 概述
   3.3.2 列族数据库
   3.3.3 键值数据库
   3.3.4 文档数据库
   3.3.5 图数据库
  关键术语
  本章小结
  即测即评
 第4章 计算与处理
  4.1 批处理
   4.1.1 批处理概念
   4.1.2 批处理关键框架
   4.1.3 批处理关键技术
  4.2 流处理
   4.2.1 从批处理到流处理的演变
   4.2.2 典型流计算平台
  4.3 交互式分析
   4.3.1 交互式分析的需求
   4.3.2 HBase 交互式分析的业务流程
   4.3.3 交互式分析的典型平台
  4.4 案例分析
  关键术语
  本章小结
  即测即评
 第5章 数据获取技术
  5.1 数据分类
  5.2 内部数据获取
   5.2.1 内部数据获取流程
   5.2.2 内部数据获取工具
   5.2.3 内部数据获取注意事项
  5.3 外部数据获取
   5.3.1 外部数据获取渠道
   5.3.2 外部数据获取流程
   5.3.3 外部数据获取工具
   5.3.4 外部数据获取代码示例
  5.4 外部数据采集案例分析
   5.4.1 小说网站爬取案例
   5.4.2 微信公众号爬取案例
   5.4.3 新闻网站爬取案例
  关键术语
  本章小结
  即测即评
 第6章 数据预处理
  6.1 数据质量
   6.1.1 数据质量的问题根源
   6.1.2 数据质量评估
  6.2 数据清洗
   6.2.1 缺失数据处理
   6.2.2 噪声数据处理
  6.3 数据集成
   6.3.1 模式识别和对象匹配
   6.3.2 数据冗余处理
   6.3.3 冲突检测与处理
  6.4 数据变换
   6.4.1 数据规范化
   6.4.2 数据离散化
   6.4.3 数据泛化
   6.4.4 数据脱敏
  6.5 数据归约
   6.5.1 维归约
   6.5.2 数值归约
  关键术语
  本章小结
  即测即评
 第7章 大数据分析技术
  7.1 大数据分析基础
  7.2 回归分析
   7.2.1 线性回归
   7.2.2 广义线性回归
  7.3 分类分析
   7.3.1 决策树分类方法
   7.3.2 贝叶斯分类方法
  7.4 聚类分析
   7.4.1 k- 均值聚类
   7.4.2 高斯混合模型
  7.5 深度学习
   7.5.1 卷积神经网络
   7.5.2 循环神经网络
  7.6 酒店数据分析案例
   7.6.1 问题背景
   7.6.2 任务描述
   7.6.3 实验步骤
  关键术语
  本章小结
  即测即评
 第8章 可视化展现
  8.1 可视化主要类型
   8.1.1 科学可视化
   8.1.2 信息可视化
   8.1.3 可视分析学
  8.2 可视化基本模型
   8.2.1 线性模型
   8.2.2 循环模型
   8.2.3 分析模型
  8.3 数据交流常用方法
   8.3.1 视觉编码
   8.3.2 统计图表
   8.3.3 图论方法
   8.3.4 视觉隐喻
   8.3.5 面向领域的方法
  8.4 典型数据可视化生成方式
   8.4.1 入门级工具
   8.4.2 信息图表工具
   8.4.3 地图工具
   8.4.4 时间线工具
   8.4.5 高级分析工具
  8.5 可视化典型案例
   8.5.1 实时推文
   8.5.2 世界语言分布图
   8.5.3 全球变暖的成因
   8.5.4 美国风力图
   8.5.5 名人作息安排
   8.5.6 年度新闻趋势图
   8.5.7 社交网络联系图
  8.6 案例分析
  关键术语
  本章小结
  即测即评
 第9章 《 西游记》文本分析案例
  9.1 案例目标
  9.2 案例准备
   9.2.1 环境准备
   9.2.2 数据预处理
   9.2.3 构建全文索引
   9.2.4 制作字典
   9.2.5 分词算法
  9.3 案例实战
   9.3.1 词频统计
   9.3.2 筛选特征词
   9.3.3 主成分分析(PCA)
  9.4 小结
 第10章 旅游网站大数据分析案例
  10.1 案例目标
  10.2 案例准备
  10.3 案例实战
   10.3.1 实验数据
   10.3.2 数据抓取
   10.3.3 数据存储
   10.3.4 数据分析
   10.3.5 数据可视化
  10.4 小结
 第11章 在线用户行为分析案例
  11.1 案例目标
  11.2 案例准备
  11.3 案例实战
   11.3.1 数据抽取
   11.3.2 数据探索分析
   11.3.3 数据预处理
   11.3.4 模型构建
   11.3.5 上机实验
   11.3.6 拓展思考
  11.4 小结
 参考文献