全国大中专教材网络采选系统

推荐纸质教材推荐数字资源

大数据架构应用之Hadoop / 高等职业教育计算机教育新形态系列教材

定价：￥45.00

作者：查欣，钱冲冲

出版时间：2025-08

最新印次日期：2025-8

出版社：中国铁道出版社

以下为《大数据架构应用之Hadoop》的配套数字资源，这些资源在您购买图书后将免费附送给您：

关闭

基本信息评价

出版社：中国铁道出版社
ISBN：9787113314934
版次：1-1
本季征订号：61265572-0
开本：16开
出版时间：2025-08
职教专业大类：电子与信息大类
职教专业类：计算机类
适用专业：计算机类
适用分级：高职

作者简介

查欣，淄博职业学院人工智能与大数据学院副院长，从事职业教育教学近二十年，《计算机文化基础》《三维动画设计与制作》《Java语言程序设计》《面向对象程序设计语言》《VISIO制图实务》《操作系统基础》《计算机网络技术》等多门专业核心课程和实训实习课程的教学工作。连续6个学期教学质量评价等级为A等，2019年获院长质量奖；荣获院级“教学名师”“优秀教育工作者”“优秀工会工作者”等荣誉称号。主讲国家精品资源共享课1门，省级精品课程3门，山东省第三批品牌专业群核心成员，物联网应用技术国家骨干专业核心成员；院级精品资源共享课《计算机文化基础》主持人；院级课程思政改革立项《面向对象程序设计》主持人。指导学生参加山东省职业院校技能大赛（高职组）“物联网技术应用”竞赛项目获三等奖；指导学生参加第三届山东省互联网大学生创新创业大赛获铜奖；指导学生参加全国大学生计算机应用能力与信息素养大赛获二等奖1项，三等奖2项；指导学生参加第八届全国高校数字艺术设计大赛全国总决赛二等奖；指导学生参加淄博市职业院校技能大赛获二等奖若干；本人参加淄博市职业技能大赛获二等奖，并被评为淄博市技术能手。钱冲冲，就职于淄博职业学院，从事职业教育教学近5年

查看全部

内容简介

本书为“高等职业教育计算机教育新形态系列教材”之一，围绕Hadoop生态圈相关系统介绍大数据处理架构，分为六个学习情境。学习情境一讲解Hadoop相关概念、集群的搭建；学习情境二讲解Hadoop分布式文件系统（HDFS）；学习情境三讲解MapReduce分布式计算框架的相关知识；学习情境四讲解Hive数据仓库的相关知识；学习情境五讲解Flume日志采集系统的基本知识；学习情境六介绍Zookeeper分布式协调服务。
本书内容讲解以课堂实训案例为主线。通过学习本书，学生能够掌握Hadoop生态圈的基本功能，提升对大数据架构的实际应用能力。本书附有案例的视频、源文件及效果文件，以利于教师授课、学生学习。
本书适合作为高等职业院校大数据技术专业的教材，也可供相关人员学习参考。

学习情境一Hadoop集群的搭建1
1.1学习情境描述1
1.2学习目标1
1.3Hadoop平台搭建的基础工作1
1.3.1项目引导1
1.3.2项目任务书2
1.3.3项目工作实施4
1.4实战演练——Hadoop集群搭建9
1.4.1实战演练一安装JDK9
1.4.2实战演练二安装Hadoop11
1.4.3实战演练三Hadoop集群配置11
1.4.4实战演练四Hadoop集群测试14
1.5项目总结报告17
1.6习题17
学习情境二HDFS分布式文件系统19
2.1学习情境描述19
2.2学习目标19
2.3HDFS的Shell操作19
2.3.1项目引导19
2.3.2项目任务书20
2.3.3HDFS的组成21
2.3.4HDFS的Shell操作24
2.4实战演练——HDFS的上传与下载28
2.4.1实战演练一搭建项目环境28
2.4.2实战演练二初始化客户端对象31
2.4.3实战演练三上传与下载文件到HDFS31
2.4.4实战演练四HDFS目录查看34
2.5项目总结报告37
2.6习题38
学习情境三MapReduce分布式计算框架40
3.1学习情境描述40
3.2学习目标40
3.3MapReduce基础工作41
3.3.1项目引导41
3.3.2项目任务书42
3.3.3MapReduce核心原理44
3.4实战演练——MapReduce程序开发与运行48
3.4.1实战演练一开发环境搭建（IDEA+Maven）48
3.4.2实战演练二WordCount单词统计案例实现50
3.4.3实战演练三MapReduce程序提交到集群运行54
3.4.4实战演练四程序运行日志分析与故障排查57
3.5项目总结报告60
3.6习题61
学习情境四YARN资源调度与管理63
4.1学习情境描述63
4.2学习目标63
4.3YARN基础工作64
4.3.1项目引导64
4.3.2项目任务书65
4.3.3YARN架构与核心组件67
4.4实战演练——YARN集群配置与任务调度70
4.4.1实战演练一YARN核心配置文件修改70
4.4.2实战演练二YARN集群启停与状态查看73
4.4.3实战演练三资源调度策略（FIFO/Capacity）配置75
4.4.4实战演练四YARNWeb界面（8088端口）监控与管理78
4.5项目总结报告80
4.6习题81
学习情境五Flume日志采集93
5.1学习情境描述93
5.2学习目标93
5.3Flume日志采集93
5.3.1项目引导93
5.3.2项目任务书95
5.3.3Flume安装97
5.4实战演练——Flume项目任务实施98
5.4.1实战演练一配置采集方案98
5.4.2实战演练二采集方案配置说明101
5.4.3实战演练三Flume可靠性保障之负载均衡设计108
5.4.4实战演练四Flume拦截器的应用与实战110
5.4.5实战演练五Flume采集方案综合案例实现112
5.5项目总结报告116
5.6习题117
学习情境六Zookeeper分布式协调服务118
6.1学习情境描述118
6.2学习目标118
6.3Zookeeper的基础工作119
6.3.1项目引导119
6.3.2项目任务书119
6.4认识Zookeeper120
6.4.1Zookeeper的诞生120
6.4.2Zookeeper的产生原因121
6.4.3Zookeeper的核心功能122
6.4.4Zookeeper集群角色123
6.5实战演练——Zookeeper分布式集群部署126
6.5.1实战演练一环境准备126
6.5.2实战演练二搭建Zookeeper集群127
6.5.3实战演练三启动Zookeeper集群129
6.6ZookeeperShell常用命令131
6.7Zookeeper的JavaAPI操作133
6.8项目总结报告139
6.9习题140