大数据平台搭建与配置管理 / 高等职业教育校企合作系列教材·大数据技术与应用专业
定价:¥42.00
作者: 邓建萍
出版时间:2020-08
最新印次日期:2021-9
出版社:中国铁道出版社
试读
- 中国铁道出版社
- 9787113271350
- 1-2
- 364866
- 68260621-5
- 平装
- 16开
- 2020-08
- 331
- 224
- 电子与信息大类
- 计算机类
- 计算机类
- 高职
作者简介
内容简介
大数据平台搭建与配置管理”课程是大数据技术与应用专业的必修核心课程。本书重点培养读者深入认识和使用Hadoop平台,学习并掌握Hadoop大数据平台的搭建与配置管理,并利用Hadoop知识处理和解决实际问题的能力。主要内容为Hadoop安装与配置、分布式文件系统HDFS、分布式编程框架MapReduce、分布式服务框架Zookeeper、数据仓库Hive、分布式数据库HBase、流式数据处理框架Storm。本书具有较强的实用性和可操作性,通俗易懂,操作步骤描述详尽,并配有微课视频。
本书适合作为高等职业院校大数据技术与应用、软件技术、云计算技术与应用等专业大数据相关课程的教材,也可作为从事大数据相关工作人员的参考用书,还可供有Java编程基础的读者参考学习
本书适合作为高等职业院校大数据技术与应用、软件技术、云计算技术与应用等专业大数据相关课程的教材,也可作为从事大数据相关工作人员的参考用书,还可供有Java编程基础的读者参考学习
目录
单元1Hadoop安装与配置1
任务1.1安装Linux虚拟环境1
1Linux系统介绍2
2开源协议介绍7
任务1.2使用Linux基础操作命令16
1Linux文件和目录管理16
2Linux用户和用户组管理19
3LinuxShell简介20
任务1.3安装Java28
1Java简介28
2Java与Hadoop的关系34
任务1.4安装Hadoop单节点和集群37
1Hadoop简介37
2Hadoop系统架构41
小结46
习题46
单元2分布式文件系统HDFS47
任务2.1理解HDFS的读写过程47
1HDFS文件系统简介47
2HDFS设计原则49
3HDFS核心概念51
4HDFS的HA方案53
任务2.2使用Java操作HDFS58
1HDFS简介59
2HDFS读数据流程59
3HDFS写数据流程61
小结69
习题69
单元3分布式编程框架MapReduce70
任务3.1讲解WordCount实例70
1MapReduce概述70
2MapReduce计算架构73
任务3.2分析MapReduce实例应用83
1MapReduce的Map过程83
2MapReduce的Reduce过程85
小结91
习题92
单元4分布式服务框架Zookeeper95
任务4.1安装与配置Zookeeper93
1Zookeeper概述94
2Zookeeper工作流96
3Zookeeperleader选举100
任务4.2调用Zookeeper的Java客户端API103
1Zookeeper分布式协调服务原理103
2Zookeeperznode剖析105
3解读分布式锁110
小结118
习题118
单元5数据仓库Hive119
任务5.1安装与配置Hive119
1Hive基础知识120
2Hive的工作123
3Hive的数据类型124
4Hive的数据模型125
5Hive的架构解析126
6HiveQL127
任务5.2调用Hive的JavaAPI133
1Hive函数与自定义函数134
2Hive常用模式设计137
小结146
习题146
单元6分布式数据库HBase148
任务6.1安装与配置HBase148
1HBase概述149
2HBase基本原则和架构152
3HBase数据模型154
4HBaseHDFS目录分析155
任务6.2使用HBaseShell159
1HBaseShell常用命令159
2HBase架构详情162
3HBase文件存储与读写166
任务6.3调用HBase的JavaAPI175
1HBaseSchema设计规则175
2HBaseAPI基本访问命令179
小结185
习题186
单元7流式数据处理框架Storm190
任务7.1安装与配置Storm188
1Storm概述与架构188
2Storm、Flink、Spark流式数据处理框架比较192
3Storm基本概念与组件195
4Storm的扩展197
任务7.2使用Java开发Storm203
1深入剖析StormNimbus和Supervisor203
2StormWorker、Executor和Task深入分析205
3Storm的应用开发和调试过程介绍206
小结217
习题217
参考文献218
任务1.1安装Linux虚拟环境1
1Linux系统介绍2
2开源协议介绍7
任务1.2使用Linux基础操作命令16
1Linux文件和目录管理16
2Linux用户和用户组管理19
3LinuxShell简介20
任务1.3安装Java28
1Java简介28
2Java与Hadoop的关系34
任务1.4安装Hadoop单节点和集群37
1Hadoop简介37
2Hadoop系统架构41
小结46
习题46
单元2分布式文件系统HDFS47
任务2.1理解HDFS的读写过程47
1HDFS文件系统简介47
2HDFS设计原则49
3HDFS核心概念51
4HDFS的HA方案53
任务2.2使用Java操作HDFS58
1HDFS简介59
2HDFS读数据流程59
3HDFS写数据流程61
小结69
习题69
单元3分布式编程框架MapReduce70
任务3.1讲解WordCount实例70
1MapReduce概述70
2MapReduce计算架构73
任务3.2分析MapReduce实例应用83
1MapReduce的Map过程83
2MapReduce的Reduce过程85
小结91
习题92
单元4分布式服务框架Zookeeper95
任务4.1安装与配置Zookeeper93
1Zookeeper概述94
2Zookeeper工作流96
3Zookeeperleader选举100
任务4.2调用Zookeeper的Java客户端API103
1Zookeeper分布式协调服务原理103
2Zookeeperznode剖析105
3解读分布式锁110
小结118
习题118
单元5数据仓库Hive119
任务5.1安装与配置Hive119
1Hive基础知识120
2Hive的工作123
3Hive的数据类型124
4Hive的数据模型125
5Hive的架构解析126
6HiveQL127
任务5.2调用Hive的JavaAPI133
1Hive函数与自定义函数134
2Hive常用模式设计137
小结146
习题146
单元6分布式数据库HBase148
任务6.1安装与配置HBase148
1HBase概述149
2HBase基本原则和架构152
3HBase数据模型154
4HBaseHDFS目录分析155
任务6.2使用HBaseShell159
1HBaseShell常用命令159
2HBase架构详情162
3HBase文件存储与读写166
任务6.3调用HBase的JavaAPI175
1HBaseSchema设计规则175
2HBaseAPI基本访问命令179
小结185
习题186
单元7流式数据处理框架Storm190
任务7.1安装与配置Storm188
1Storm概述与架构188
2Storm、Flink、Spark流式数据处理框架比较192
3Storm基本概念与组件195
4Storm的扩展197
任务7.2使用Java开发Storm203
1深入剖析StormNimbus和Supervisor203
2StormWorker、Executor和Task深入分析205
3Storm的应用开发和调试过程介绍206
小结217
习题217
参考文献218














