深入理解大数据:大数据处理与编程实践 / 计算机类专业系统能力培养系列教材
¥79.00定价
作者: 黄宜华
出版时间:2014-07
出版社:机械工业出版社
- 机械工业出版社
- 9787111473251
- 1版
- 180252
- 47229885-0
- 平装
- 16开
- 2014-07
- 725
- 518
- 工学
- 计算机科学与技术
- TP274
- 计算机通信类
- 本科
内容简介
黄宜华主编的《深入理解大数据(大数据处理与编程实践)》从Hadoop MapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术.较为全面地介绍了基本ManReduce算法设计、高级MapRcduce编程技术以殛一系列较为复杂的机器学习和数据挖掘井行化算法,并引入来自IntelHadoop系统的一系列增强功能以及深度技术剖析;最后.为了提高读者的算法设计与编程宴战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题采自课程同学参加的全国性大数据大赛中的获奖算法、课程中的优秀课程设计以及来自本团队的科研课题及业界实际的大数据应用实战案例。书中第8章和第10章的所有算法均有完整宴现代码可供下载学习。
本书是国内第一本基于多年课堂教学实践总结和撰写而成的大数据处理和并行编程技术书籍,因此,本书非常适合高等院校作为MapReduce大数据并行处理技术课程教材使用,同时也很适合于高等院校学生作为自学ManReduce并行处理技术的参考书。与此同时,由于本书包含了很多来自业界实际产品的深度技术内容、井包括了丰富的算法设计和编程实战案例,因此,本书也很适合作为IT和其他应用行业专业技术人员进行大数据处理应用开发和编程实现时的参考手册。
本书是国内第一本基于多年课堂教学实践总结和撰写而成的大数据处理和并行编程技术书籍,因此,本书非常适合高等院校作为MapReduce大数据并行处理技术课程教材使用,同时也很适合于高等院校学生作为自学ManReduce并行处理技术的参考书。与此同时,由于本书包含了很多来自业界实际产品的深度技术内容、井包括了丰富的算法设计和编程实战案例,因此,本书也很适合作为IT和其他应用行业专业技术人员进行大数据处理应用开发和编程实现时的参考手册。
目录
推荐序一
推荐序二
推荐序三
丛书序言
前 言
第一部分 Hadoop系统
第1章 大数据处理技术简介
1.1 并行计算技术简介
1.1.1 并行计算的基本概念
1.1.2 并行计算技术的分类
1.1.3 并行计算的主要技术问题
1.2 大数据处理技术简介
1.2.1 大数据的发展背景和研究意义
1.2.2 大数据的技术特点
1.2.3 大数据研究的主要目标、基本原则和基本途径
1.2.4 大数据计算模式和系统
1.2.5 大数据计算模式的发展趋势
1.2.6 大数据的主要技术层面和技术内容
1.3 MapReduce并行计算技术简介
1.3.1 MapReduce的基本概念和由来
1.3.2 MapReduce的基本设计思想
1.3.3 MapReduce的主要功能和技术特征
1.4 Hadoop系统简介
1.4.1 Hadoop的概述与发展历史
1.4.2 Hadoop系统分布式存储与并行计算构架
1.4.3 Hadoop平台的基本组成与生态系统
1.4.4 Hadoop的应用现状和发展趋势
第2章 Hadoop系统的安装与操作管理
2.1 Hadoop系统安装方法简介
2.2 单机和单机伪分布式Hadoop系统安装基本步骤
2.2.1 安装和配置
2.2.2 创建Hadoop用户
2.2.3 下载安装H
2.2.4 配置
2.2.5 配置Hadoop环境
2.2.6 Hadoop的运行
2.2.7 运行测试程序
2.2.8 查看集群状态
2.3 集群分布式Hadoop系统安装基本步骤
2.3.1 安装和配置
2.3.2 创建Hadoop用户
2.3.3 下载安装H
2.3.4 配置
2.3.5 配置Hadoop环境
2.3.6 Hadoop的运行
2.3.7 运行测试程序
2.3.8 查看集群状态
2.4 Hadoop MapReduce程序开发过程
2.5 集群远程作业提交与执行
2.5.1 集群远程作业提交和执行过程
2.5.2 查看作业执行结果和集群状态
第3章 大数据存储——分布式文件系?
3.1 HDFS的基本特征与构架
第4章 Hadoop MapReduce并行编程框架
第5章 分布式数据库
第6章 分布式数据仓库
第7章 Intel Hadoop系统优化与功能增强
第二部分 MapReduce的编程和算法设计
第8章 MapReduce基础算法程序设计
第9章 MapReduce高级程序设计技术
第10章 MapReduce数据挖掘基础算法
第11章 大数据处理算法设计与应用编程案例
附 录
附录A OpenMP并行程序设计简介
附录B MPI并行程序设计简介
附录C 英特尔Apache Hadoop*系统安装手册
参考文献
推荐序二
推荐序三
丛书序言
前 言
第一部分 Hadoop系统
第1章 大数据处理技术简介
1.1 并行计算技术简介
1.1.1 并行计算的基本概念
1.1.2 并行计算技术的分类
1.1.3 并行计算的主要技术问题
1.2 大数据处理技术简介
1.2.1 大数据的发展背景和研究意义
1.2.2 大数据的技术特点
1.2.3 大数据研究的主要目标、基本原则和基本途径
1.2.4 大数据计算模式和系统
1.2.5 大数据计算模式的发展趋势
1.2.6 大数据的主要技术层面和技术内容
1.3 MapReduce并行计算技术简介
1.3.1 MapReduce的基本概念和由来
1.3.2 MapReduce的基本设计思想
1.3.3 MapReduce的主要功能和技术特征
1.4 Hadoop系统简介
1.4.1 Hadoop的概述与发展历史
1.4.2 Hadoop系统分布式存储与并行计算构架
1.4.3 Hadoop平台的基本组成与生态系统
1.4.4 Hadoop的应用现状和发展趋势
第2章 Hadoop系统的安装与操作管理
2.1 Hadoop系统安装方法简介
2.2 单机和单机伪分布式Hadoop系统安装基本步骤
2.2.1 安装和配置
2.2.2 创建Hadoop用户
2.2.3 下载安装H
2.2.4 配置
2.2.5 配置Hadoop环境
2.2.6 Hadoop的运行
2.2.7 运行测试程序
2.2.8 查看集群状态
2.3 集群分布式Hadoop系统安装基本步骤
2.3.1 安装和配置
2.3.2 创建Hadoop用户
2.3.3 下载安装H
2.3.4 配置
2.3.5 配置Hadoop环境
2.3.6 Hadoop的运行
2.3.7 运行测试程序
2.3.8 查看集群状态
2.4 Hadoop MapReduce程序开发过程
2.5 集群远程作业提交与执行
2.5.1 集群远程作业提交和执行过程
2.5.2 查看作业执行结果和集群状态
第3章 大数据存储——分布式文件系?
3.1 HDFS的基本特征与构架
第4章 Hadoop MapReduce并行编程框架
第5章 分布式数据库
第6章 分布式数据仓库
第7章 Intel Hadoop系统优化与功能增强
第二部分 MapReduce的编程和算法设计
第8章 MapReduce基础算法程序设计
第9章 MapReduce高级程序设计技术
第10章 MapReduce数据挖掘基础算法
第11章 大数据处理算法设计与应用编程案例
附 录
附录A OpenMP并行程序设计简介
附录B MPI并行程序设计简介
附录C 英特尔Apache Hadoop*系统安装手册
参考文献