- 中国铁道出版社
- 9787113248543
- 1-1
- 226022
- 61239250-6
- 平装
- 16开
- 2018-12
- 232
- 168
- 工学
- 计算机科学与技术
- TP274
- 计算机类
内容简介
本书是将大数据基本理论与基本应用有机结合的教材,按照定义、特征、技术流程和典型案例分析的方式编写,抽丝剥茧,由易到难,有助于读者理解和掌握大数据技术。
本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书在每一章均附有实际应用案例与关键词注释,方便读者查阅和自学,同时配备了习题和参考答案。
本书适合作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。
本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书在每一章均附有实际应用案例与关键词注释,方便读者查阅和自学,同时配备了习题和参考答案。
本书适合作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。
目录
第1章大数据概论
1.1大数据技术简介
1.1.1IT产业的发展简史
1.1.2大数据的主要来源
1.1.3数据生成的三种主要
方式
1.1.4大数据的特点
1.1.5大数据的处理流程
1.1.6大数据的数据格式
1.1.7大数据的基本特征
1.1.8大数据的应用领域
1.2大数据的技术架构
1.3大数据的整体技术
1.4大数据分析的四种典型工具
简介
1.5大数据未来发展趋势
1.5.1数据资源化
1.5.2数据科学和数据联盟的
成立
1.5.3大数据隐私和安全
问题
1.5.4开源软件成为推动大数
据发展的动力
1.5.5大数据在多方位改善人
们的生活
本章小结
习题1
第2章大数据采集及预处理
2.1数据采集简介
2.1.1数据采集
2.1.2数据采集的数据来源
2.1.3数据采集的技术方法
2.2大数据的预处理
2.3数据采集及预处理的主要
工具
本章小结
习题2
第3章大数据分析概论
3.1大数据分析简介
3.1.1大数据分析
3.1.2大数据分析的基本
方法
3.1.3大数据处理流程
3.2大数据分析的主要技术
3.2.1深度学习
3.2.2知识计算
3.3大数据分析处理系统简介
3.3.1批量数据及处理系统
3.3.2流式数据及处理系统
3.3.3交互式数据及处理
系统
3.3.4图数据及处理系统
3.4大数据分析的应用
本章小结
习题3
第4章大数据可视化
4.1大数据可视化简介
4.2大数据可视化工具
Tableau
本章小结
习题4
第5章Hadoop概论
5.1Hadoop简介
5.1.1Hadoop简史
5.1.2Hadoop应用和发展
趋势
5.2Hadoop的架构与组成
5.2.1Hadoop架构介绍
5.2.2Hadoop组成模块
5.3Hadoop应用分析
本章小结
习题5
大数据应用基础
目录
第6章HDFS和Common概论
6.1HDFS简介
6.1.1HDFS的相关概念
6.1.2HDFS特性
6.1.3HDFS体系结构
6.1.4HDFS的工作原理
6.1.5HDFS的相关技术
6.2Common简介
本章小结
习题6
第7章MapReduce概论
7.1MapReduce简介
7.1.1MapReduce
7.1.2MapReduce功能、特征和
局限性
7.2Map和Reduce任务
7.3MapReduce架构和工作
流程
7.3.1MapReduce的架构
7.3.2MapReduce的工作
流程
本章小结
习题7
第8章NoSQL概论
8.1NoSQL简介
8.1.1NoSQL的含义
8.1.2NoSQL的产生
8.1.3NoSQL的特点
8.2NoSQL技术基础
8.2.1大数据的一致性策略
8.2.2大数据的分区与放置
策略
8.2.3大数据的复制与容错
技术
8.2.4大数据的缓存技术
8.3NoSQL的类型
8.3.1键值存储
8.3.2列存储
8.3.3面向文档存储
8.3.4图形存储
8.4典型的NoSQL工具
8.4.1Redis
8.4.2Bigtable
8.4.3CouchDB
本章小结
习题8
第9章Spark概论
9.1Spark平台
9.1.1Spark简介
9.1.2Spark发展
9.1.3Scala语言
9.2Spark与Hadoop
9.2.1Hadoop的局限与不足
9.2.2Spark的优点
9.2.3Spark速度比Hadoop快的
原因分析
9.3Spark处理架构及其生态
系统
9.3.1底层的Cluster Manager
和Data Manager
9.3.2中间层的Spark
Runtime
9.3.3高层的应用模块
9.4Spark的应用
9.4.1Spark的应用场景
9.4.2应用Spark的成功
案例
本章小结
习题9
第10章云计算与大数据
10.1云计算简介
10.1.1云计算
10.1.2云计算与大数据的
关系
10.1.3云计算基本特征
10.1.4云计算服务模式
10.2云计算核心技术
10.2.1虚拟化技术
10.2.2虚拟化软件及应用
10.2.3资源池技术
10.2.4云计算部署模式
10.3云计算应用案例
本章小结
习题10
第11章典型大数据解决方案
11.1Intel大数据
11.1.1Intel大数据解决
方案
11.1.2Intel大数据相关
案例
11.2百度大数据
11.2.1百度大数据引擎
11.2.2百度大数据+平台
11.2.3相关应用
11.2.4百度预测的使用
方法
11.3腾讯大数据
11.3.1腾讯大数据解决
方案
11.3.2相关实例
本章小结
习题11
第12章大数据应用案例分析(医疗
领域)
12.1大数据在临床领域的
应用
12.1.1基于大数据的比较效
果研究
12.1.2基于大数据的临床决
策系统
12.1.3医疗数据透明化
12.1.4病人的远程监控
12.1.5基于大数据的电子
病历分析
12.2大数据在医药支付领域的
应用
12.2.1基于大数据的多种
自动化系统
12.2.2基于大数据和卫生
经济学的定价计划
12.3大数据在医疗研发领域的
应用
12.3.1基于大数据的预测
建模
12.3.2临床试验及其数据
分析
12.3.3基于大数据的个性
化治疗
12.3.4基于大数据的疾病
模式分析
12.4大数据在医疗商业模式
领域的应用
12.4.1基于大数据的患者临床记录
和医疗保险数据集
12.4.2基于大数据的网络
平台和社区
12.5大数据在公共健康领域的
应用
本章小结
习题12
习题参考答案
参考文献
1.1大数据技术简介
1.1.1IT产业的发展简史
1.1.2大数据的主要来源
1.1.3数据生成的三种主要
方式
1.1.4大数据的特点
1.1.5大数据的处理流程
1.1.6大数据的数据格式
1.1.7大数据的基本特征
1.1.8大数据的应用领域
1.2大数据的技术架构
1.3大数据的整体技术
1.4大数据分析的四种典型工具
简介
1.5大数据未来发展趋势
1.5.1数据资源化
1.5.2数据科学和数据联盟的
成立
1.5.3大数据隐私和安全
问题
1.5.4开源软件成为推动大数
据发展的动力
1.5.5大数据在多方位改善人
们的生活
本章小结
习题1
第2章大数据采集及预处理
2.1数据采集简介
2.1.1数据采集
2.1.2数据采集的数据来源
2.1.3数据采集的技术方法
2.2大数据的预处理
2.3数据采集及预处理的主要
工具
本章小结
习题2
第3章大数据分析概论
3.1大数据分析简介
3.1.1大数据分析
3.1.2大数据分析的基本
方法
3.1.3大数据处理流程
3.2大数据分析的主要技术
3.2.1深度学习
3.2.2知识计算
3.3大数据分析处理系统简介
3.3.1批量数据及处理系统
3.3.2流式数据及处理系统
3.3.3交互式数据及处理
系统
3.3.4图数据及处理系统
3.4大数据分析的应用
本章小结
习题3
第4章大数据可视化
4.1大数据可视化简介
4.2大数据可视化工具
Tableau
本章小结
习题4
第5章Hadoop概论
5.1Hadoop简介
5.1.1Hadoop简史
5.1.2Hadoop应用和发展
趋势
5.2Hadoop的架构与组成
5.2.1Hadoop架构介绍
5.2.2Hadoop组成模块
5.3Hadoop应用分析
本章小结
习题5
大数据应用基础
目录
第6章HDFS和Common概论
6.1HDFS简介
6.1.1HDFS的相关概念
6.1.2HDFS特性
6.1.3HDFS体系结构
6.1.4HDFS的工作原理
6.1.5HDFS的相关技术
6.2Common简介
本章小结
习题6
第7章MapReduce概论
7.1MapReduce简介
7.1.1MapReduce
7.1.2MapReduce功能、特征和
局限性
7.2Map和Reduce任务
7.3MapReduce架构和工作
流程
7.3.1MapReduce的架构
7.3.2MapReduce的工作
流程
本章小结
习题7
第8章NoSQL概论
8.1NoSQL简介
8.1.1NoSQL的含义
8.1.2NoSQL的产生
8.1.3NoSQL的特点
8.2NoSQL技术基础
8.2.1大数据的一致性策略
8.2.2大数据的分区与放置
策略
8.2.3大数据的复制与容错
技术
8.2.4大数据的缓存技术
8.3NoSQL的类型
8.3.1键值存储
8.3.2列存储
8.3.3面向文档存储
8.3.4图形存储
8.4典型的NoSQL工具
8.4.1Redis
8.4.2Bigtable
8.4.3CouchDB
本章小结
习题8
第9章Spark概论
9.1Spark平台
9.1.1Spark简介
9.1.2Spark发展
9.1.3Scala语言
9.2Spark与Hadoop
9.2.1Hadoop的局限与不足
9.2.2Spark的优点
9.2.3Spark速度比Hadoop快的
原因分析
9.3Spark处理架构及其生态
系统
9.3.1底层的Cluster Manager
和Data Manager
9.3.2中间层的Spark
Runtime
9.3.3高层的应用模块
9.4Spark的应用
9.4.1Spark的应用场景
9.4.2应用Spark的成功
案例
本章小结
习题9
第10章云计算与大数据
10.1云计算简介
10.1.1云计算
10.1.2云计算与大数据的
关系
10.1.3云计算基本特征
10.1.4云计算服务模式
10.2云计算核心技术
10.2.1虚拟化技术
10.2.2虚拟化软件及应用
10.2.3资源池技术
10.2.4云计算部署模式
10.3云计算应用案例
本章小结
习题10
第11章典型大数据解决方案
11.1Intel大数据
11.1.1Intel大数据解决
方案
11.1.2Intel大数据相关
案例
11.2百度大数据
11.2.1百度大数据引擎
11.2.2百度大数据+平台
11.2.3相关应用
11.2.4百度预测的使用
方法
11.3腾讯大数据
11.3.1腾讯大数据解决
方案
11.3.2相关实例
本章小结
习题11
第12章大数据应用案例分析(医疗
领域)
12.1大数据在临床领域的
应用
12.1.1基于大数据的比较效
果研究
12.1.2基于大数据的临床决
策系统
12.1.3医疗数据透明化
12.1.4病人的远程监控
12.1.5基于大数据的电子
病历分析
12.2大数据在医药支付领域的
应用
12.2.1基于大数据的多种
自动化系统
12.2.2基于大数据和卫生
经济学的定价计划
12.3大数据在医疗研发领域的
应用
12.3.1基于大数据的预测
建模
12.3.2临床试验及其数据
分析
12.3.3基于大数据的个性
化治疗
12.3.4基于大数据的疾病
模式分析
12.4大数据在医疗商业模式
领域的应用
12.4.1基于大数据的患者临床记录
和医疗保险数据集
12.4.2基于大数据的网络
平台和社区
12.5大数据在公共健康领域的
应用
本章小结
习题12
习题参考答案
参考文献