- 北京邮电大学出版社
- 9787563558735
- 285154
- 48255227-0
- 2019-12
- 工学
- 计算机科学与技术
- 计算机类
- 本科
内容简介
大数据技术课程实验侧重介绍大数据软件的安装、使用和基础编程方法。主要包括大数据关键技术和系统软件,Linux操作系统的安装方法,Hadoop分布式框架的安装和使用方法,HDFS分布式文件系统的编程方法,HBase分布式数据库的安装和基础编程方法,No-SQL数据库的安装和基础编程方法,MapReduce分布式框架的基础编程方法,Hive数据仓库的安装和使用方法,Spark基于内存的分布式计算框架的安装和基础编程方法,典型可视化工具的安装和使用方法,数据采集工具的安装和使用方法,大数据课程综合实验等。
目录
第1章大数据存储:分布式文件系统及NoSQL数据库实验教程1 1.1HDFS常用操作1 1.2HBase的安装6 1.3HBase的Shell连接与数据操作7 1.4Redis数据库的安装和使用11 1.5MongoDB数据库的安装和使用17 1.6Neo4j数据库的安装和使用22 第2章大数据处理:MapReduce处理框架实验教程27 2.1实验目的27 2.2实验要求27 2.3预备知识27 2.4实验内容(5个实验)28 2.5实验作业64 2.6扩展资料65 2.7参考答案78 第3章大数据处理:分布式处理框架Spark实验教程79 3.1Spark安装79 3.2Sparkshell83 3.3Spark Scala87 3.4Spark Python99 3.5Spark MLlib103 第4章大数据处理:实时处理框架实验教程110 4.1Storm伪分布式部署及其基本操作110 4.2Flume安装及其基本操作124 4.3Kafka安装及其基本操作131 4.4Spark Streaming安装及其基本操作135 4.5Flink安装及其基本操作150 第5章大数据分析:分布式数据查询实验教程164 5.1Hive的数据导入与数据查询164 5.2Druid的安装171 5.3Druid的数据摄入与数据查询175 5.4Drill的部署181 5.5Drill命令行与PyDrill的基础使用183 第6章大数据分析:Kylin多维分析实验教程186 6.1Kylin的安装186 6.2Demo案例实战189 6.3多维分析的Cube创建实战193 6.4通过RESTful访问Kylin208 第7章大数据可视化实验教程215 7.1ECharts数据可视化215 7.2Plotly数据可视化218 绘制知识图谱222 第8章大数据综合实验案例231 8.1案例简介231 8.2实验步骤232 8.3数据集下载232 8.4数据集导入数据仓库Hive233 8.5Hive数据分析237 8.6数据挖掘240 参考文献247