- 中国铁道出版社
- 9787113279431
- 1版
- 403636
- 68250127-5
- 平装
- 16开
- 2021-07
- 1005
- 520
- 工学
- 计算机科学与技术
- 计算机类
- 高职
内容简介
本书是为所有热爱大数据、打算从事大数据相关工作的读者编写的,适合有Java编程基础的学习者参考使用。本书全面介绍了大数据技术生态圈,更在此基础上全景展现了Hadoop大数据分布式系统集群平台的搭建、大数据分布式文件系统HDFS、大数据分布式并行计算框架MapReduce、Hadoop大数据仓库工具Hive和海量日志采集工具Flume等大数据实用技术。本书通俗易懂、结构清晰,着重于分析解决问题的思路和具体实施过程。
本书适合作为高等院校计算机相关专业的程序设计教材,也可作为Hadoop技术的培训图书。
本书适合作为高等院校计算机相关专业的程序设计教材,也可作为Hadoop技术的培训图书。
目录
第1章 初识Hadoop及HDFS分布式系统1
1.1 初识Hadoop1
1.1.1大数据概述1
1.1.2大数据技术2
1.1.3Hadoop简介3
1.2 分布式文件系统(HDFS)6
1.2.1分布式文件系统6
1.2.2HDFS的定义7
1.3 Hadoop伪分布式环境搭建12
1.3.1Hadoop安装的三种模式 12
1.3.2搭建的准备工作 12
1.3.3Hadoop相关配置12
1.3.4启动Hadoop13
1.4 HDFS常用命令与应用13
1.4.1HDFS命令行基本操作 13
1.4.2HDFS Java API的核心类
和接口21
1.4.3基于Java API的编程实例 21
小结55
习题55
第2章 分布式协调服务——ZooKeeper
和HDFS高可用性56
2.1 ZooKeeper的作用和基本概念56
2.1.1分布式应用概述56
2.1.2分布式应用的优缺点57
2.1.3ZooKeeper 的概念和特点58
2.1.4ZooKeeper 的主要应用58
2.1.5ZooKeeper的架构58
2.1.6数据模型与层次命名空间59
2.1.7Znode的类型59
2.2 ZooKeeper集群的搭建60
2.3 ZooKeeper操作与API编程69
2.3.1服务端常用命令 69
2.3.2客户端连接ZooKeeper的
相关操作70
2.3.3使用Java API访问
ZooKeeper75
2.3.4使用Java API编程
——入门案例75
2.3.5使用Java API编程
——官方案例解读93
2.4 ZooKeeper原理分析105
2.4.1一致性协议——Zab协议105
2.4.2Leader选举106
2.5 高可用108
2.6 HDFS缓存108
2.7 HDFS完全分布式搭建115
2.8 HDFS高可用架构搭建116
2.8.1HDFS的基本架构116
2.8.2HDFS高可用架构116
2.8.3高可用架构搭建思路117
小结118
习题118
第3章 分布式并行计
1.1 初识Hadoop1
1.1.1大数据概述1
1.1.2大数据技术2
1.1.3Hadoop简介3
1.2 分布式文件系统(HDFS)6
1.2.1分布式文件系统6
1.2.2HDFS的定义7
1.3 Hadoop伪分布式环境搭建12
1.3.1Hadoop安装的三种模式 12
1.3.2搭建的准备工作 12
1.3.3Hadoop相关配置12
1.3.4启动Hadoop13
1.4 HDFS常用命令与应用13
1.4.1HDFS命令行基本操作 13
1.4.2HDFS Java API的核心类
和接口21
1.4.3基于Java API的编程实例 21
小结55
习题55
第2章 分布式协调服务——ZooKeeper
和HDFS高可用性56
2.1 ZooKeeper的作用和基本概念56
2.1.1分布式应用概述56
2.1.2分布式应用的优缺点57
2.1.3ZooKeeper 的概念和特点58
2.1.4ZooKeeper 的主要应用58
2.1.5ZooKeeper的架构58
2.1.6数据模型与层次命名空间59
2.1.7Znode的类型59
2.2 ZooKeeper集群的搭建60
2.3 ZooKeeper操作与API编程69
2.3.1服务端常用命令 69
2.3.2客户端连接ZooKeeper的
相关操作70
2.3.3使用Java API访问
ZooKeeper75
2.3.4使用Java API编程
——入门案例75
2.3.5使用Java API编程
——官方案例解读93
2.4 ZooKeeper原理分析105
2.4.1一致性协议——Zab协议105
2.4.2Leader选举106
2.5 高可用108
2.6 HDFS缓存108
2.7 HDFS完全分布式搭建115
2.8 HDFS高可用架构搭建116
2.8.1HDFS的基本架构116
2.8.2HDFS高可用架构116
2.8.3高可用架构搭建思路117
小结118
习题118
第3章 分布式并行计