注册 登录 进入教材巡展
#
  • #

出版时间:2019-11

出版社:北京邮电大学出版社

以下为《流数据分析技术》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 北京邮电大学出版社
  • 9787563559152
  • 285167
  • 48255234-6
  • 2019-11
  • 工学
  • 计算机科学与技术
  • 计算机类
  • 本科
内容简介
《流数据分析技术》是大数据方向本科生的专业选修课教材。教材包括综述性内容、技术性内容和实践性内容。其中,综述性内容包括大数据技术综述、流数据分析技术综述。技术性内容包括流数据采集技术、流数据处理技术、流数据存储技术、流数据分析技术、流数据处理架构技术,使读者能够对流数据的数据筛选、数据存储、数据处理调度等相关技术有充分的了解,使读者能够掌握流数据的分布特征计算、基于回归模型和神经网络模型的态势预测等基本原理和算法。实践类内容包括主流流数据处理框架的介绍、几种基础流数据处理方法的实现。通过本教材的学习,使学生了解流式大数据技术和应用的演进趋势,掌握流式大数据项目的一般过程,掌握流式大数据分析和处理的常用技术,并结合实践项目培养学生针对流数据的应用开发实践能力。
目录
第1章 流数据与流计算
1.1 大数据
1.1.1 大数据的发展
1.1.2 大数据的概念
1.1.3 大数据思维
1.2 流数据
1.2.1 流数据的场景
1.2.2 流数据的特点
1.2.3 流数据的概念
1.3 流数据处理
1.3.1 批处理模型
1.3.2 流式处理模型
1.3.3 流式处理与窗口模型
1.3.4 流式处理与概要结构
1.3.5 批处理与流式处理的对比
1.4 流数据分析
1.4.1 频繁项挖掘算法
1.4.2 聚类算法
1.4.3 分类算法
1.4.4 回归算法
1.5 流数据机器学习
1.6 小结
本章知识点
扩展阅读
习题1

第2章 流数据概要结构构建技术
2.1 流数据处理的概要结构
2.2 抽样概要结构
2.2.1 抽样
2.2.2 伯努利抽样
2.2.3 水库抽样
2.2.4 简明抽样
2.3 草图概要结构
2.3.1 草图
2.3.2 计数草图
2.3.3 增广草图
2.3.4 布隆过滤器
2.3.5 FM基数估计草图
2.4 小波概要结构
2.5 直方图概要结构
2.5.1 直方图
2.5.2 等宽直方图
2.6 小结
本章知识点
扩展阅读
习题2

第3章 流数据频繁模式挖掘技术
3.1 频繁模式挖掘问题的定义
3.2 不同窗口模型的频繁模式挖掘
3.3 频繁项挖掘算法
3.3.1 黏性抽样算法
3.3.2 KPS算法
3.4 频繁模式挖掘算法
3.4.1 有损计数算法
3.4.2 有损计数算法扩展
3.5 频繁模式挖掘的其他相关问题
3.6 小结
本章知识点
扩展阅读
习题3

第4章 流数据聚类分析技术
4.1 聚类算法
4.2 流数据聚类的评价
4.2.1 内部度量
4.2.2 外部度量
4.3 不同窗口模型的聚类分析
4.4 基于划分的流数据聚类算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于层次的流数据聚类算法
4.6 基于密度的流数据聚类算法
4.7 基于网格的流数据聚类算法
4.8 其他流数据聚类算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小结
本章知识点
扩展阅读
习题4

第5章 流数据分类分析技术
5.1 。分类算法
5.2 流数据分类的评价
5.2.1 误差估计
5.2.2 性能评价指标
5.2.3 统计显著性
5.2.4 成本度量
5.3 基于贝叶斯的分类算法
5.4 基于决策树的分类算法
5.4.1 快速决策树算法
5.4.2 概念自适应快速决策树算法
5.5 其他流数据分类算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自适应树算法
5.6 小结
本章知识点
扩展阅读
习题5

第6章 流数据学习与时间序列分析技术
6.1 时间序列
6.1.1 时间序列的分类与特征
6.1.2 时间序列的表示与拟合
6.1.3 时间序列的预测
6.2 在线学习模型
6.3 流数据学习评价
6.3.1 误差
6.3.2 Regret界
6.4 模型学习算法
6.4.1 ARIMA算法
6.4.2 在线ARIMA算法
6.5 实例学习算法
6.5.1 岭回归与LASSO回归
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 最优化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小结
本章知识点
扩展阅读
习题6

第7章 流数据处理模型与框架
7.1 流数据处理计算模型
7.2 流计算的状态与一致性
7.2.1 流计算的状态
7.2.2 流计算的一致性
7.3 流计算处理中的时间
7.4 流计算实现框架
7.5 Storm流处理框架
7.5.1 基于流的处理拓扑结构
7.5.2 记录级容错
7.5.3 Storm的系统架构
7.6 Spark流处理框架
7.6.1 基于RDD的微批处理结构
7.6.2 基于RDD依赖的容错
7.6.3 Spark的系统架构
7.7 Flink流处理框架
7.7.1 基于流水线的处理结构
7.7.2 基于分布式快照的容错
7.7.3 Flink的系统架构
7.8 小结
本章知识点
扩展阅读
习题7
参考文献