- 电子工业出版社
- 9787121380822
- 1-6
- 292601
- 66254541-7
- 平塑
- 16开
- 2023-06
- 397
- 248
- 工学
- 计算机科学与技术
- 计算机基础与科学理论
- 高职
作者简介
目录
第1章 大数据与Hadoop平台技术 1__eol__1.1 大数据时代 1__eol__1.2 大数据关键技术 2__eol__1.3 大数据涉及的主要软件 3__eol__1.4 Hadoop平台技术的生态 4__eol__第2章 Ubuntu系统的安装与使用 7__eol__2.1 Linux系统简介 7__eol__2.2 Ubuntu系统安装 8__eol__2.2.1 下载虚拟机软件VMware并安装 8__eol__2.2.2 在虚拟机中安装Ubuntu系统 14__eol__2.2.3 切换中英文输入法 27__eol__2.2.4 安装VMware Tools 28__eol__2.2.5 apt更新与更新源更换 30__eol__2.2.6 安装vim编辑器并使用 32__eol__2.3 虚拟机联网问题及其他 34__eol__第3章 Linux基础知识及相关软件的基本使用 39__eol__3.1 Linux基础知识 39__eol__3.1.1 Linux目录结构 39__eol__3.1.2 Shell介绍 40__eol__3.1.3 超级用户——root用户 41__eol__3.1.4 sudo命令和su命令 41__eol__3.1.5 创建与删除普通用户 42__eol__3.1.6 目录标记规则 43__eol__3.1.7 目录权限 43__eol__3.1.8 安装SSH 44__eol__3.2 Linux常用软件与命令 45__eol__3.2.1 修改主机名 45__eol__3.2.2 目录操作 45__eol__3.2.3 查看文件内容和清屏 46__eol__3.2.4 文件操作 46__eol__3.2.5 文件解压 47__eol__3.2.6 进程与端口查看命令 48__eol__3.2.7 系统管理命令 49__eol__3.2.8 数据流重定向和管道的使用 50__eol__3.2.9 其他使用技巧介绍 51__eol__3.3 在Ubuntu中安装Eclipse 51__eol__3.3.1 通过软件中心下载安装Eclipse 51__eol__3.3.2 在桌面创建Eclipse快捷方式 52__eol__第4章 Hadoop的伪分布式安装与使用 54__eol__4.1 深入了解Hadoop 54__eol__4.1.1 Hadoop发行版本介绍 54__eol__4.1.2 Hadoop核心架构 55__eol__4.1.3 Hadoop的主要应用场景 56__eol__4.2 安装Java环境 57__eol__4.2.1 离线安装 57__eol__4.2.2 在线安装 58__eol__4.3 安装Hadoop 59__eol__4.3.1 下载Hadoop安装文件并解压 59__eol__4.3.2 配置Hadoop环境变量 60__eol__4.3.3 伪分布式模式配置 61__eol__4.3.4 Hadoop无法正常启动和使用的解决方法 63__eol__第5章 HDFS 65__eol__5.1 HDFS基本知识 65__eol__5.1.1 DFS简介 65__eol__5.1.2 HDFS 65__eol__5.1.3 HDFS存储数据 66__eol__5.2 Shell命令与HDFS交互操作 67__eol__5.2.1 Hadoop Shell命令方式 67__eol__5.2.2 目录操作 68__eol__5.2.3 文件操作 69__eol__5.2.4 利用Web界面管理HDFS 70__eol__5.3 Java编程与HDFS实现交互 71__eol__5.3.1 在Eclipse中创建HDFS交互Java项目 71__eol__5.3.2 在Java项目中编写Java应用程序代码 75__eol__5.3.3 编译运行程序与打包 77__eol__5.3.4 练习中使用的代码文件 81__eol__第6章 HBase伪分布部署与使用 85__eol__6.1 HBase介绍 85__eol__6.2 安装HBase 86__eol__6.3 伪分布HBase环境搭建 87__eol__6.4 HBase Shell常用操作命令实践 90__eol__6.4.1 HBase表结构举例说明和常用的表操作命令 90__eol__6.4.2 在HBase中创建表和删除表 91__eol__6.4.3 HBase数据库基本操作 92__eol__第7章 MapReduce原理与基础编程 94__eol__7.1 MapReduce介绍与基本原理 94__eol__7.1.1 MapReduce在现实生活中的运用 94__eol__7.1.2 通过案例拆解MapReduce的工作过程 95__eol__7.1.3 MapReduce工作流程概括 98__eol__7.2 MapReduce编程思路 98__eol__7.3 MapReduce编程实例1:WordCount 99__eol__7.4 MapReduce编程实例2:计算学生的平均成绩 109__eol__第8章 数据仓库Hive伪分布式部署与使用 113__eol__8.1 Hive的特点 113__eol__8.2 Hive伪分布式部署 114__eol__8.2.1 安装配置Hive 114__eol__8.2.2 安装配置MySQL,连接Hive元数据库 115__eol__8.3 MySQL数据库操作 118__eol__8.3.1 常用命令介绍 118__eol__8.3.2 无法登录MySQL Shell的解决方法 120__eol__第9章 数据分析与Hive数据库操作 121__eol__9.1 Hive操作命令介绍 121__eol__9.2 HQL中的Case命令用法介绍 122__eol__9.3 电商网站日志数据分析与达成目标 124__eol__9.4 数据分析实现 126__eol__9.4.1 将网站日志文件集加载到Hive中 126__eol__9.4.2 统计分析网站日志数据 127__eol__9.4.3 统计词频 131__eol__第10章 Spark的安装与基础编程 133__eol__10.1 Spark的安装(Python版) 133__eol__10.1.1 下载Spark安装软件 134__eol__10.1.2 安装与配置Spark 134__eol__10.1.3 在PySpark中运行代码 135__eol__10.1.4 Spark独立应用程序编程示例 136__eol__10.2 Spark的一些基本概念 137__eol__10.3 RDD编程操作 137__eol__10.3.1 RDD操作的两种类型 137__eol__10.3.2 创建RDD 139__eol__10.3.3 创建键值对RDD 142__eol__10.4 从RDD到DataFrame 145__eol__10.4.1 Spark SQL和DataFrame 145__eol__10.4.2 创建样例数据文件 146__eol__10.4.3 读取json和csv文件生成DataFrame 147__eol__10.4.4 普通文本文件生成DataFrame 148__eol__10.5 Spark综合编程与Python可视化 151__eol__10.5.1 Spark综合编程 151__eol__10.5.2 Python可视化呈现 154__eol__第11章 Hadoop集群环境搭建 160__eol__11.1 克隆Linux虚拟机 160__eol__11.2 桥接模式与NAT模式 163__eol__11.2.1 桥接模式 163__eol__11.2.2 NAT模式 164__eol__11.3 VMware Workstation桥接网络配置 164__eol__11.3.1 集群网络配置实现的目标 164__eol__11.3.2 设置网络桥接模式 165__eol__11.3.3 验证 169__eol__11.4 大数据集群环境配置与搭建 170__eol__11.4.1 修改主机名,并将主机名与IP地址建立映射 170__eol__11.4.2 集群SSH免密登录 171__eol__11.4.3 时间同步 173__eol__第12章 Zookeeper与集群Hadoop安装应用 174__eol__12.1 Zookeeper介绍 174__eol__12.1.1 Zookeeper的作用 174__eol__12.1.2 Zookeeper选举机制 175__eol__12.2 安装Zookeeper 175__eol__12.2.1 为安装Zookeeper的目录赋权 175__eol__12.2.2 下载、解压Zookeeper安装包 175__eol__12.2.3 修改Zookeeper配置文件zoo.cfg 176__eol__12.2.4 创建zkdata和zkdatalog文件夹 177__eol__12.2.5 创建文件myid