- 人民邮电出版社
- 9787115339867
- 1-1
- 284354
- 46211750-8
- 平装
- 16开
- 2014-04
- 568
- 352
- 工学
- 计算机科学与技术
- 大数据与云计算
- 本科
内容简介
《大数据走向云计算》以Hadoop为铺垫,以概念、价值、动向及应用为导线,系统地介绍了大数据走向云计算的原理与技术。首先,介绍了云时代、大数据时代的基本内容,让读者了解到云计算、大数据各自的知识点;其次,介绍了大数据走向云端、云下的大数据工程,让读者领略到大数据在云的作用下的价值及应用;然后,介绍了搭建云计算开发环境、分布式文件系统、并行计算、分布式锁等内容,让读者认识到Hadoop组件的构建及使用;接着,介绍了数据挖掘、社会中的大数据等应用,让读者掌握到大数据走向云端的需求及益处。最后,总结介绍云下的大数据应用,让读者真正领会到大数据走向云端的实际效用。
《大数据走向云计算》适合于云计算、大数据初中级读者使用,也可作为大数据专业研究人员的参考资料。
《大数据走向云计算》适合于云计算、大数据初中级读者使用,也可作为大数据专业研究人员的参考资料。
目录
第1章 云时代
1.1 云计算力量
1.2 云计算概述
1.2.1 云基本特征
1.2.2 云计算简史
1.2.3 云计算演化
1.2.4 云服务形式
1.2.5 云时代谁是主角
1.3 云计算的原动力
1.3.1 芯片与硬件技术
1.3.2 资源虚拟化
1.3.3 面向服务架构
1.3.4 软件即服务
1.3.5 互联网技术
1.3.6 Web技术
1.4 云研究趋势
1.5 云计算技术
1.5.1 虚拟化技术
1.5.2 数据存储技术
1.5.3 资源管理技术
1.5.4 能耗管理技术
1.5.5 云监测技术
1.6 云优势分析
1.6.1 优化产业布局
1.6.2 推进专业分工
1.6.3 提升资源利用率
1.6.4 降低运营成本
1.6.5 产生新创价值
1.7 云业务实施
1.7.1 基础设施层
1.7.2 平台层
1.7.3 实施应用层
1.8 移动云
1.8.1 移动云优势
1.8.2 应用案例
1.9 云标准
1.9.1 云标准定制
1.9.2 云标准主要内容
1.9.3 云计算潜在需求分析
1.9.4 云标准意义
1.9.5 云标准发展趋势
1.10 云安全
1.10.1 云安全发展趋势
1.10.2 云安全难点问题
1.10.3 云安全新增及增强功能
1.10.4 云安全存在问题
1.11 云计算的九大威胁
第2章 大数据时代
2.1 什么是大数据
2.2 大数据来源
2.3 大数据商业价值
2.4 打造高能效数据中心
2.5 大数据变革
2.5.1 变革公共卫生
2.5.2 变革商业
2.5.3 变革思维
2.5.4 开启重大的时代转型
2.6 大数据的核心
2.7 大数据的挑战
2.8 大数据的现状
2.9 大数据推进力
2.10 大数据存储
2.11 大数据治理
2.12 大数据未来五年路线
2.13 大数据的应用
第3章 大数据走向云端
3.1 时代双雄
3.2 “大数据”走进云端
3.3 云计算与大数据的联系
3.3.1 云与大数据的联系
3.3.2 大数据和云计算的不同之处
3.4 数据向云计算迁移
3.4.1 迁移过程
3.4.2 数据的丢失与备份
3.4.3 迁移应注意问题
3.4.4 管理与监控
3.5 云延伸
3.5.1 云计算的延伸
3.5.2 网络管理维护优化
3.5.3 用户行为分析
3.5.4 个性化推荐
3.5.5 数据云服务(DaaS)
3.6 云计算与大数据挑战与机遇并存
第4章 云下的大数据工程
4.1 信息所需求的新生力量
4.1.1 技术因素
4.1.2 商业模式因素
4.2 信息系统工程
4.2.1 云计算基本思想
4.2.2 云计算实现
4.3 信息系统工程架构转变
4.3.1 竖井式的信息系统
4.3.2 逐渐完善的系统需求
4.3.3 全新的系统架构
4.3.4 新型企业信息系统模块
4.4 商业变革因素
4.4.1 零售企业的流程再造
4.4.2 IT资源使用新方式
4.4.3 整合的新平台
4.4.4 转型新思路
4.4.5 创新的新动力
4.5 信息工业革命
4.5.1 解放生产力
4.5.2 云计算改变信息生活
4.5.3 推动社会变革
4.6 云计算机遇
4.6.1 私有云发展更快
4.6.2 数据集中
4.6.3 企业的“云”机遇
4.6.4 中国“云”企业的机遇挑战
第5章 搭建云计算开发环境
5.1 Hadoop环境搭建
5.1.1 在Linux下安装Hadoop
5.1.2 Hadoop安装步骤
5.1.3 在Windows下安装Hadoop
5.2 Hadoop的优点
5.3 HBase环境搭建
5.3.1 HBase的系统框架
5.3.2 HBase的模型
5.3.3 HBase的安装配置
5.4 ZooKeeper环境搭建
5.4.1 ZooKeeper的原理
5.4.2 Zookeeper的特点
5.4.3 Zookeeper的安装
5.5 MapReduce概述
5.5.1 MapReduce实现机制
5.5.2 MapReduce执行流程
5.5.3 MapReduce映射和化简
5.6 Pig环境搭建
5.6.1 Pig概述
5.6.2 Pig安装
第6章 分布式文件系统
6.1 分布式文件系统概述
6.1.1 发展史
6.1.2 实现方法
6.1.3 研究状况
6.2 分布式文件系统类型
6.2.1 网络文件系统
6.2.2 Andrew文件系统
6.2.3 分布式文件系统
6.3 xFS概述
6.3.1 xFS体系结构
6.3.2 xFS通信
6.3.3 xFS进程
6.3.4 xFS缓存
6.3.5 xFS容错性
6.3.6 xFS安全性
6.3.7 xFS特性
6.3.8 xFS性能考虑
6.4 DAFS概述
6.4.1 DAFS基本原理
6.4.2 DAFS设计目的
6.4.3 文件访问方式
6.4.4 实现客户端
6.5 GFS概述
6.5.1 文件系统架构
6.5.2 GFS的特点
6.5.3 文件系统的容错性
6.5.4 系统管理技术
6.6 GPFS共享文件
6.6.1 GPFS概述
6.6.2 GPFS特性
6.6.3 GPFS的高性能和可扩展性
6.7 Lustre并行文件系统
6.7.1 Lustre概述
6.7.2 Lustre组成部分
6.8 分布式锁服务Chubby
6.8.1 Paxos算法
6.8.2 Chubby目标设计
6.8.3 Chubby中的Paxos
6.8.4 Chubby文件系统
6.8.5 Chubby通信协议
6.8.6 正确性和性能
6.9 分布式结构数据表
6.9.1 Bigtable设计目标
6.9.2 Bigtable数据模型
6.9.3 Bigtable系统架构
6.9.4 Bigtable功能
6.9.5 Bigtable主服务器
6.9.6 Bigtable组件
6.9.7 性能优化
第7章 并行计算
7.1 并行计算概述
7.2 MapReduce基础
7.2.1 编程模型
7.2.2 执行过程
7.2.3 映射和化简
7.2.4 数据类型
7.2.5 Map类和Reduce类
7.2.6 Job对象配置
7.3 MapReduce模板
7.4 MapReduce计算流程
7.4.1 作业的提交
7.4.2 Map任务的分配
7.4.3 Map任务的执行
7.4.4 Reduce任务的分配与执行
7.5 MapReduce数据流优化
7.5.1 MapReduce输入与输出
7.5.2 流机制
7.5.3 管道机制
7.5.4 数据流优化
7.6 MapReduce数据类型
7.6.1 数据内置输入格式
7.6.2 数据定制输入格式
7.6.3 数据定制输出格式
7.7 MapReduce使用算法
7.7.1 向量乘法实现
7.7.2 内存处理
7.7.3 关系运算
7.8 参数/数据文件的传递与使用
7.8.1 传递全局作业参数
7.8.2 查询全局MapReduce作业属性
7.8.3 全局数据文件的传递
第8章 大数据存储仓库
8.1 数据仓库
8.1.1 RDBMS扩展到HBase
8.1.2 列数据库
8.1.3 HBase的特点
8.2 HBase数据库
8.2.1 HBase集群架构
8.2.2 HBase系统架构
8.3 HBase模型
8.3.1 逻辑模型
8.3.2 物理模型
8.4 HBase接口
8.4.1 HBase访问接口
8.4.2 shell命令接口
8.4.3 HBase Java接口
8.5 HBase基本操作
8.5.1 HBase存储格式
8.5.2 HBase读写流程
8.5.3 HBase表操作
第9章 分布式锁
9.1 ZooKeeper基本概述
9.1.1 ZooKeeper基本原理
9.1.2 统一命名服务
9.1.3 配置管理
9.1.4 集群管理
9.1.5 分布式锁
9.1.6 共享锁(Locks)
9.1.7 队列
9.2 ZooKeeper角色
9.2.1 系统模型
9.2.2 数据模型
9.2.3 ZooKeeper的特性
9.2.4 ZooKeeper的一致性
9.3 ZooKeeper接口与编程
9.3.1 ZooKeeper接口
9.3.2 ZooKeeper编程实现
9.4 性能
9.4.1 读/写性能测试
9.4.2 可靠性测试
9.5 ZooKeeper的典型应用
9.5.1 数据发布与订阅应用
9.5.2 负载均衡应用
9.5.3 分布式通知
第10章 数据挖掘
10.1 数据挖掘概述
10.1.1 数据挖掘起源
10.1.2 数据挖掘作用
10.1.3 定义数据挖掘
10.1.4 哈希函数
10.1.5 索引
10.1.6 实现数据挖掘步骤
10.2 PageRank工具
10.2.1 PageRank概述
10.2.2 PageRank定义
10.2.3 PageRank相关算法
10.2.4 影响PageRank的因素
10.3 关联分析
10.3.1 关联分析原理及算法
10.3.2 数据关联推测功能
10.3.3 基于用户行为分析的关联推荐
10.3.4 数据关联注意问题
10.4 聚类分析
10.4.1 聚类分析作用
10.4.2 聚类的典型要求
10.4.3 聚类分析算法
10.4.4 在数据挖掘中的应用
10.5 分类分析
10.5.1 决策树法
10.5.2 神经网络
10.6 异常挖掘
10.6.1 异常挖掘概述
10.6.2 异常挖掘的方法
10.7 特异群组分析
10.7.1 特性群级挖掘根源
10.7.2 何为特异群组挖掘
10.7.3 与聚类、异常挖掘的差异
10.8 矩估计
10.8.1 二阶矩估计的AMS算法
10.8.2 高阶矩估计
10.8.3 限流的处理
10.9 衰减窗口
10.9.1 定义衰减窗口
10.9.2 网络流频繁项集
10.10 频繁项集
10.10.1 项集概述
10.10.2 A-Priori算法
10.10.3 A-Priori算法改进
10.10.4 更大数据集处理
10.11 数据降维处理
10.11.1 相关定义
10.11.2 降维算法
10.11.3 降维方法
第11章 社会中的大数据
11.1 普适计算
11.1.1 普适计算定义
11.1.2 普适计算核心思想
11.1.3 普适计算目的
11.1.4 普适计算特点
11.1.5 普适计算面临挑战
11.1.6 普适计算应用
11.2 数据应用于治国上
11.2.1 循“数”管理
11.2.2 数据验证民权
11.2.3 数据“打”假
11.3 商务智能
11.3.1 数据到知识的跨越
11.3.2 数据仓库
11.3.3 联机分析
11.3.4 数据挖掘智能产生
11.3.5 数据可视化
11.4 数据质量法与隐私
11.4.1 数据质量法
11.4.2 数据隐私
11.5 数据运动
11.5.1 数据开放
11.5.2 数据之争
11.6 数据大趋势
11.6.1 数据权
11.6.2 数据大合流
11.6.3 互联网再造
11.7 数据大挑战
11.7.1 数据竞争
11.7.2 从大数据到社会
第12章 云下的大数据应用
12.1 云计算如何实现价值
12.2 云与大数据
12.2.1 大的数据优先级
12.2.2 云与大数据
12.3 云计算与大数据的强强联合
12.3.1 大数据的企业与技术
12.3.2 大数据的经济意义
12.4 大数据时代下的云计算应用部署
12.5 云计算在快速消费品行业的应用
12.5.1 改变传统交通管理的路径
12.5.2 在智能交通应用上的优势
12.6 大数据在视频监控中的应用
12.6.1 解决实时视点监控需求
12.6.2 大数据处理解决方案
12.6.3 实时高效的分布式视频监控
12.7 区域医疗大数据应用案例
12.7.1 挑战
12.7.2 海量数据的处理和分析
12.7.3 结论
12.7.4 价值
1.1 云计算力量
1.2 云计算概述
1.2.1 云基本特征
1.2.2 云计算简史
1.2.3 云计算演化
1.2.4 云服务形式
1.2.5 云时代谁是主角
1.3 云计算的原动力
1.3.1 芯片与硬件技术
1.3.2 资源虚拟化
1.3.3 面向服务架构
1.3.4 软件即服务
1.3.5 互联网技术
1.3.6 Web技术
1.4 云研究趋势
1.5 云计算技术
1.5.1 虚拟化技术
1.5.2 数据存储技术
1.5.3 资源管理技术
1.5.4 能耗管理技术
1.5.5 云监测技术
1.6 云优势分析
1.6.1 优化产业布局
1.6.2 推进专业分工
1.6.3 提升资源利用率
1.6.4 降低运营成本
1.6.5 产生新创价值
1.7 云业务实施
1.7.1 基础设施层
1.7.2 平台层
1.7.3 实施应用层
1.8 移动云
1.8.1 移动云优势
1.8.2 应用案例
1.9 云标准
1.9.1 云标准定制
1.9.2 云标准主要内容
1.9.3 云计算潜在需求分析
1.9.4 云标准意义
1.9.5 云标准发展趋势
1.10 云安全
1.10.1 云安全发展趋势
1.10.2 云安全难点问题
1.10.3 云安全新增及增强功能
1.10.4 云安全存在问题
1.11 云计算的九大威胁
第2章 大数据时代
2.1 什么是大数据
2.2 大数据来源
2.3 大数据商业价值
2.4 打造高能效数据中心
2.5 大数据变革
2.5.1 变革公共卫生
2.5.2 变革商业
2.5.3 变革思维
2.5.4 开启重大的时代转型
2.6 大数据的核心
2.7 大数据的挑战
2.8 大数据的现状
2.9 大数据推进力
2.10 大数据存储
2.11 大数据治理
2.12 大数据未来五年路线
2.13 大数据的应用
第3章 大数据走向云端
3.1 时代双雄
3.2 “大数据”走进云端
3.3 云计算与大数据的联系
3.3.1 云与大数据的联系
3.3.2 大数据和云计算的不同之处
3.4 数据向云计算迁移
3.4.1 迁移过程
3.4.2 数据的丢失与备份
3.4.3 迁移应注意问题
3.4.4 管理与监控
3.5 云延伸
3.5.1 云计算的延伸
3.5.2 网络管理维护优化
3.5.3 用户行为分析
3.5.4 个性化推荐
3.5.5 数据云服务(DaaS)
3.6 云计算与大数据挑战与机遇并存
第4章 云下的大数据工程
4.1 信息所需求的新生力量
4.1.1 技术因素
4.1.2 商业模式因素
4.2 信息系统工程
4.2.1 云计算基本思想
4.2.2 云计算实现
4.3 信息系统工程架构转变
4.3.1 竖井式的信息系统
4.3.2 逐渐完善的系统需求
4.3.3 全新的系统架构
4.3.4 新型企业信息系统模块
4.4 商业变革因素
4.4.1 零售企业的流程再造
4.4.2 IT资源使用新方式
4.4.3 整合的新平台
4.4.4 转型新思路
4.4.5 创新的新动力
4.5 信息工业革命
4.5.1 解放生产力
4.5.2 云计算改变信息生活
4.5.3 推动社会变革
4.6 云计算机遇
4.6.1 私有云发展更快
4.6.2 数据集中
4.6.3 企业的“云”机遇
4.6.4 中国“云”企业的机遇挑战
第5章 搭建云计算开发环境
5.1 Hadoop环境搭建
5.1.1 在Linux下安装Hadoop
5.1.2 Hadoop安装步骤
5.1.3 在Windows下安装Hadoop
5.2 Hadoop的优点
5.3 HBase环境搭建
5.3.1 HBase的系统框架
5.3.2 HBase的模型
5.3.3 HBase的安装配置
5.4 ZooKeeper环境搭建
5.4.1 ZooKeeper的原理
5.4.2 Zookeeper的特点
5.4.3 Zookeeper的安装
5.5 MapReduce概述
5.5.1 MapReduce实现机制
5.5.2 MapReduce执行流程
5.5.3 MapReduce映射和化简
5.6 Pig环境搭建
5.6.1 Pig概述
5.6.2 Pig安装
第6章 分布式文件系统
6.1 分布式文件系统概述
6.1.1 发展史
6.1.2 实现方法
6.1.3 研究状况
6.2 分布式文件系统类型
6.2.1 网络文件系统
6.2.2 Andrew文件系统
6.2.3 分布式文件系统
6.3 xFS概述
6.3.1 xFS体系结构
6.3.2 xFS通信
6.3.3 xFS进程
6.3.4 xFS缓存
6.3.5 xFS容错性
6.3.6 xFS安全性
6.3.7 xFS特性
6.3.8 xFS性能考虑
6.4 DAFS概述
6.4.1 DAFS基本原理
6.4.2 DAFS设计目的
6.4.3 文件访问方式
6.4.4 实现客户端
6.5 GFS概述
6.5.1 文件系统架构
6.5.2 GFS的特点
6.5.3 文件系统的容错性
6.5.4 系统管理技术
6.6 GPFS共享文件
6.6.1 GPFS概述
6.6.2 GPFS特性
6.6.3 GPFS的高性能和可扩展性
6.7 Lustre并行文件系统
6.7.1 Lustre概述
6.7.2 Lustre组成部分
6.8 分布式锁服务Chubby
6.8.1 Paxos算法
6.8.2 Chubby目标设计
6.8.3 Chubby中的Paxos
6.8.4 Chubby文件系统
6.8.5 Chubby通信协议
6.8.6 正确性和性能
6.9 分布式结构数据表
6.9.1 Bigtable设计目标
6.9.2 Bigtable数据模型
6.9.3 Bigtable系统架构
6.9.4 Bigtable功能
6.9.5 Bigtable主服务器
6.9.6 Bigtable组件
6.9.7 性能优化
第7章 并行计算
7.1 并行计算概述
7.2 MapReduce基础
7.2.1 编程模型
7.2.2 执行过程
7.2.3 映射和化简
7.2.4 数据类型
7.2.5 Map类和Reduce类
7.2.6 Job对象配置
7.3 MapReduce模板
7.4 MapReduce计算流程
7.4.1 作业的提交
7.4.2 Map任务的分配
7.4.3 Map任务的执行
7.4.4 Reduce任务的分配与执行
7.5 MapReduce数据流优化
7.5.1 MapReduce输入与输出
7.5.2 流机制
7.5.3 管道机制
7.5.4 数据流优化
7.6 MapReduce数据类型
7.6.1 数据内置输入格式
7.6.2 数据定制输入格式
7.6.3 数据定制输出格式
7.7 MapReduce使用算法
7.7.1 向量乘法实现
7.7.2 内存处理
7.7.3 关系运算
7.8 参数/数据文件的传递与使用
7.8.1 传递全局作业参数
7.8.2 查询全局MapReduce作业属性
7.8.3 全局数据文件的传递
第8章 大数据存储仓库
8.1 数据仓库
8.1.1 RDBMS扩展到HBase
8.1.2 列数据库
8.1.3 HBase的特点
8.2 HBase数据库
8.2.1 HBase集群架构
8.2.2 HBase系统架构
8.3 HBase模型
8.3.1 逻辑模型
8.3.2 物理模型
8.4 HBase接口
8.4.1 HBase访问接口
8.4.2 shell命令接口
8.4.3 HBase Java接口
8.5 HBase基本操作
8.5.1 HBase存储格式
8.5.2 HBase读写流程
8.5.3 HBase表操作
第9章 分布式锁
9.1 ZooKeeper基本概述
9.1.1 ZooKeeper基本原理
9.1.2 统一命名服务
9.1.3 配置管理
9.1.4 集群管理
9.1.5 分布式锁
9.1.6 共享锁(Locks)
9.1.7 队列
9.2 ZooKeeper角色
9.2.1 系统模型
9.2.2 数据模型
9.2.3 ZooKeeper的特性
9.2.4 ZooKeeper的一致性
9.3 ZooKeeper接口与编程
9.3.1 ZooKeeper接口
9.3.2 ZooKeeper编程实现
9.4 性能
9.4.1 读/写性能测试
9.4.2 可靠性测试
9.5 ZooKeeper的典型应用
9.5.1 数据发布与订阅应用
9.5.2 负载均衡应用
9.5.3 分布式通知
第10章 数据挖掘
10.1 数据挖掘概述
10.1.1 数据挖掘起源
10.1.2 数据挖掘作用
10.1.3 定义数据挖掘
10.1.4 哈希函数
10.1.5 索引
10.1.6 实现数据挖掘步骤
10.2 PageRank工具
10.2.1 PageRank概述
10.2.2 PageRank定义
10.2.3 PageRank相关算法
10.2.4 影响PageRank的因素
10.3 关联分析
10.3.1 关联分析原理及算法
10.3.2 数据关联推测功能
10.3.3 基于用户行为分析的关联推荐
10.3.4 数据关联注意问题
10.4 聚类分析
10.4.1 聚类分析作用
10.4.2 聚类的典型要求
10.4.3 聚类分析算法
10.4.4 在数据挖掘中的应用
10.5 分类分析
10.5.1 决策树法
10.5.2 神经网络
10.6 异常挖掘
10.6.1 异常挖掘概述
10.6.2 异常挖掘的方法
10.7 特异群组分析
10.7.1 特性群级挖掘根源
10.7.2 何为特异群组挖掘
10.7.3 与聚类、异常挖掘的差异
10.8 矩估计
10.8.1 二阶矩估计的AMS算法
10.8.2 高阶矩估计
10.8.3 限流的处理
10.9 衰减窗口
10.9.1 定义衰减窗口
10.9.2 网络流频繁项集
10.10 频繁项集
10.10.1 项集概述
10.10.2 A-Priori算法
10.10.3 A-Priori算法改进
10.10.4 更大数据集处理
10.11 数据降维处理
10.11.1 相关定义
10.11.2 降维算法
10.11.3 降维方法
第11章 社会中的大数据
11.1 普适计算
11.1.1 普适计算定义
11.1.2 普适计算核心思想
11.1.3 普适计算目的
11.1.4 普适计算特点
11.1.5 普适计算面临挑战
11.1.6 普适计算应用
11.2 数据应用于治国上
11.2.1 循“数”管理
11.2.2 数据验证民权
11.2.3 数据“打”假
11.3 商务智能
11.3.1 数据到知识的跨越
11.3.2 数据仓库
11.3.3 联机分析
11.3.4 数据挖掘智能产生
11.3.5 数据可视化
11.4 数据质量法与隐私
11.4.1 数据质量法
11.4.2 数据隐私
11.5 数据运动
11.5.1 数据开放
11.5.2 数据之争
11.6 数据大趋势
11.6.1 数据权
11.6.2 数据大合流
11.6.3 互联网再造
11.7 数据大挑战
11.7.1 数据竞争
11.7.2 从大数据到社会
第12章 云下的大数据应用
12.1 云计算如何实现价值
12.2 云与大数据
12.2.1 大的数据优先级
12.2.2 云与大数据
12.3 云计算与大数据的强强联合
12.3.1 大数据的企业与技术
12.3.2 大数据的经济意义
12.4 大数据时代下的云计算应用部署
12.5 云计算在快速消费品行业的应用
12.5.1 改变传统交通管理的路径
12.5.2 在智能交通应用上的优势
12.6 大数据在视频监控中的应用
12.6.1 解决实时视点监控需求
12.6.2 大数据处理解决方案
12.6.3 实时高效的分布式视频监控
12.7 区域医疗大数据应用案例
12.7.1 挑战
12.7.2 海量数据的处理和分析
12.7.3 结论
12.7.4 价值