注册 登录 进入教材巡展
#

出版时间:2024-01

出版社:电子工业出版社

以下为《Hive数据仓库案例教程》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 电子工业出版社
  • 9787121418068
  • 1-7
  • 421626
  • 48253483-1
  • 平塑
  • 16开
  • 2024-01
  • 320
  • 200
  • 工学
  • 计算机科学与技术
  • 计算机科学与技术
  • 本科
目录
第1章 Hive数据仓库基础 1__eol__1.1 数据仓库 1__eol__1.1.1 数据仓库的概念 1__eol__1.1.2 数据仓库的特点 3__eol__1.1.3 数据仓库的数据模型 3__eol__1.1.4 数据仓库的体系结构 4__eol__1.2 Hive数据仓库 5__eol__1.3 Hive体系结构及执行流程 6__eol__1.3.1 Hive体系结构 6__eol__1.3.2 Hive执行流程 8__eol__1.4 Hive数据仓库和数据库比较 8__eol__习题1 10__eol__第2章 Hive环境搭建 12__eol__2.1 Hive安装及配置 12__eol__2.1.1 Hive的安装模式 12__eol__2.1.2 Hive安装及配置过程 12__eol__2.1.3 Hive基本操作 14__eol__2.2 MySQL安装及配置 15__eol__2.2.1 MySQL安装包准备 15__eol__2.2.2 MySQL服务器端安装 15__eol__2.2.3 MySQL客户端安装 16__eol__2.3 Hive元数据配置 16__eol__2.3.1 驱动复制 16__eol__2.3.2 配置元数据到MySQL 16__eol__2.3.3 多终端启动Hive 17__eol__2.4 Hive JDBC连接 18__eol__2.4.1 HiveServer2配置 18__eol__2.4.2 HiveServer2启动 18__eol__2.4.3 Beeline启动 18__eol__2.4.4 HiveServer2连接 19__eol__2.5 Hive常见属性配置 19__eol__2.5.1 Hive位置配置 19__eol__2.5.2 信息显示配置 19__eol__2.5.3 运行日志信息配置 20__eol__2.5.4 Hive参数配置方式 20__eol__习题2 21__eol__第3章 Hive基础 23__eol__3.1 Hive数据类型 23__eol__3.1.1 基本数据类型 23__eol__3.1.2 复杂数据类型 24__eol__3.1.3 数据类型转换 24__eol__3.2 Hive运算符 25__eol__3.2.1 算术运算符 25__eol__3.2.2 比较运算符 25__eol__3.2.3 逻辑运算符 26__eol__3.2.4 复杂运算符 26__eol__3.3 Hive数据存储 27__eol__3.4 Hive表存储格式 27__eol__3.4.1 行式存储和列式存储 28__eol__3.4.2 TextFile格式 28__eol__3.4.3 SequenceFile格式 28__eol__3.4.4 ORC格式 29__eol__3.4.5 Parquet格式 29__eol__3.5 Hive常用交互命令 30__eol__3.6 Hive其他操作命令 31__eol__习题3 31__eol__第4章 Hive数据定义 34__eol__4.1 数据仓库的创建 34__eol__4.2 数据仓库的查询 35__eol__4.2.1 显示数据仓库 35__eol__4.2.2 查看数据仓库详情 35__eol__4.2.3 切换数据仓库 35__eol__4.3 数据仓库的修改 35__eol__4.4 数据仓库的删除 36__eol__4.5 表的创建 36__eol__4.5.1 内部表 37__eol__4.5.2 外部表 40__eol__4.5.3 内部表和外部表的转换 42__eol__4.6 分区表 42__eol__4.6.1 分区表基本操作 43__eol__4.6.2 二级分区表创建 45__eol__4.7 桶表 46__eol__4.8 表的修改 48__eol__4.8.1 重命名 48__eol__4.8.2 增加和删除分区 48__eol__4.8.3 修改、增加和替换列 49__eol__4.9 表的删除 51__eol__4.10 视图 52__eol__习题4 57__eol__第5章 Hive数据操作 60__eol__5.1 数据导入 60__eol__5.1.1 Load加载数据 60__eol__5.1.2 Insert插入数据 61__eol__5.1.3 As Select加载数据 63__eol__5.1.4 Location加载数据 63__eol__5.1.5 Import加载数据 64__eol__5.2 数据导出 64__eol__5.2.1 Insert语句导出 64__eol__5.2.2 Hadoop命令导出 65__eol__5.2.3 Hive Shell命令导出 65__eol__5.2.4 Export语句导出 65__eol__5.2.5 Sqoop导出 65__eol__习题5 66__eol__第6章 HQL查询 68__eol__6.1 Select基本查询 68__eol__6.1.1 全表和特定列查询 68__eol__6.1.2 列的别名 69__eol__6.1.3 Limit语句 69__eol__6.2 Where语句 69__eol__6.2.1 Like的使用 71__eol__6.2.2 Rlike的使用 72__eol__6.3 分组语句 74__eol__6.3.1 Group By语句 74__eol__6.3.2 Having语句 74__eol__6.4 Join语句 75__eol__6.4.1 等值连接 75__eol__6.4.2 表的别名 76__eol__6.4.3 内连接 76__eol__6.4.4 左外连接 76__eol__6.4.5 右外连接 76__eol__6.4.6 满外连接 76__eol__6.4.7 左半连接 77__eol__6.4.8 多表连接 77__eol__6.4.9 笛卡儿积Join 78__eol__6.5 排序 79__eol__6.5.1 Order By全局排序 79__eol__6.5.2 字段别名排序 80__eol__6.5.3 多字段排序 81__eol__6.5.4 Sort By内部排序 81__eol__6.5.5 Distribute By分区排序 83__eol__6.5.6 Cluster By排序 83__eol__6.6 抽样查询 84__eol__6.6.1 桶表抽样查询 84__eol__6.6.2 数据块抽样查询 85__eol__6.6.3 随机抽样查询 87__eol__习题6 87__eol__第7章 Hive函数 89__eol__7.1 Hive内置函数 89__eol__7.1.1 数值计算函数 89__eol__7.1.2 聚合函数 90__eol__7.1.3 日期时间函数 91__eol__7.1.4 条件函数 92__eol__7.1.5 字符串处理函数 93__eol__7.1.6 内置函数查看命令 96__eol__7.2 其他常用函数 96__eol__7.2.1 空字段赋值函数 96__eol__7.2.2 列转行函数 97__eol__7.2.3 窗口函数 100__eol__7.2.4 排序函数 106__eol__7.3 自定义函数 108__eol__7.3.1 UDF函数 108__eol__7.3.2 UDTF函数 110__eol__7.3.3 UDAF函数 112__eol__习题7 113__eol__第8章 Hive数据压缩 116__eol__8.1 数据压缩格式 116__eol__8.2 Hadoop压缩配置 117__eol__8.2.1 Snappy压缩方式配置 117__eol__8.2.2 MapReduce支持的压缩编码 118__eol__8.2.3 MapReduce压缩格式参数配置 118__eol__8.3 Map输出压缩开启 119__eol__8.4 Reduce输出压缩开启 119__eol__8.5 常用Hive表存储格式比较 120__eol__8.5.1 存储文件的压缩比测试 120__eol__8.5.2 存储文件的查询速度测试 122__eol__8.6 存储和压缩结合 123__eol__习题8 125__eol__第9章 Hive优化 127__eol__9.1 Hive参数优化 127__eol__9.1.1 本地模式 127__eol__9.1.2 Fetch抓取 128__eol__9.1.3 并行执行 128__eol__9.1.4 严格模式 129__eol__9.1.5 推测执行 130__eol__9.1.6 JVM重用 131__eol__9.2 数据倾斜 131__eol__9.2.1 合理设置Map个数 131__eol__9.2.2 合并小文件 132__eol__9.2.3 复杂文件增加Map个数 132__eol__9.2.4 合理设置R