大数据案例教程 / “十四五”普通高等教育系列教材
定价:¥30.00
作者: 林民,柳林,张树钧
出版时间:2024-08
最新印次日期:2024-8
出版社:中国铁道出版社
- 中国铁道出版社
- 9787113312541
- 1-1
- 521426
- 60269775-7
- 16开
- 2024-08
- 工学
- 计算机类
- 电子与信息大类
- 计算机类
- 计算机类
- 本科
作者简介
内容简介
实验在教学过程中占据十分重要的地位,特别是在大数据教学中尤为重要。本书针对高校在开设大数据课程过程中遇到的大数据实验指导专业师资不足、难以培养实用型人才、专业学习与实际应用脱轨等诸多问题,本着“有用、够用、实用”的原则,设计了大量的大数据实验项目,引导学生对大数据常用知识点进行探究。全书分为两部分(共11章):第一部分大数据概述及实验环境简介,内容包括大数据技术概述、实验相关组件介绍;第二部分典型案例实验,容包括销售信息查询实验、气象数据探索性分析实验、地震数据分析实验、信用卡逾期预测实验、电影推荐实验、社交网络推荐实验、航班图实验、自然语言处理实验、深度主题模型。通过学习本书,可使读者熟练掌握大数据环境下的案例开发,提高实际问题的分析和解决能力。
本书适合作为高等院校大数据及人工智能专业的实践课程教材,也可作为非计算机专业研究生学习大数据相关内容的实验指导手册。
本书适合作为高等院校大数据及人工智能专业的实践课程教材,也可作为非计算机专业研究生学习大数据相关内容的实验指导手册。
目录
第一部分大数据概述及实验环境简介
第1章大数据技术概述………………………………………………………………………2
1.1大数据概念及特征………………………………………………………………………2
1.2大数据的数据处理流程…………………………………………………………………3
1.3大数据的数据安全………………………………………………………………………6
思考题…………………………………………………………………………………………7
第2章实验相关组件介绍……………………………………………………………………8
2.1HDFS……………………………………………………………………………………8
2.2MapReduce………………………………………………………………………………11
2.3Hive……………………………………………………………………………………15
2.4HBase……………………………………………………………………………………16
2.5Storm……………………………………………………………………………………17
2.6Flume……………………………………………………………………………………18
2.7Kafka……………………………………………………………………………………19
2.8Spark……………………………………………………………………………………21
思考题…………………………………………………………………………………………27
第二部分典型案例实验
第3章销售信息查询实验…………………………………………………………………29
3.1实验目标………………………………………………………………………………29
3.2实验环境………………………………………………………………………………29
3.3实验方法………………………………………………………………………………30
3.4实验过程………………………………………………………………………………31
3.5实验总结………………………………………………………………………………40
思考题…………………………………………………………………………………………40
第4章气象数据探索性分析实验…………………………………………………………41
4.1实验目标………………………………………………………………………………41
4.2实验环境………………………………………………………………………………41
4.3实验方法………………………………………………………………………………42
4.4实验过程………………………………………………………………………………432
4.5实验总结………………………………………………………………………………47
思考题…………………………………………………………………………………………47
第5章地震数据分析实验…………………………………………………………………48
5.1实验目标…………………………………………………………………………………48
5.2实验环境………………………………………………………………………………48
5.3实验方法………………………………………………………………………………49
5.4实验过程………………………………………………………………………………50
5.5实验总结………………………………………………………………………………56
思考题…………………………………………………………………………………………56
第6章信用卡逾期预测实验………………………………………………………………57
6.1实验目标………………………………………………………………………………57
6.2实验环境………………………………………………………………………………57
6.3实验方法………………………………………………………………………………57
6.4实验过程………………………………………………………………………………58
思考题…………………………………………………………………………………………65
第7章电影推荐实验………………………………………………………………………66
7.1实验目标………………………………………………………………………………66
7.2实验环境………………………………………………………………………………66
7.3实验方法………………………………………………………………………………67
7.4实验过程………………………………………………………………………………69
7.5实验总结………………………………………………………………………………74
思考题…………………………………………………………………………………………74
第8章社交网络推荐实验…………………………………………………………………75
8.1实验目标………………………………………………………………………………75
8.2实验环境………………………………………………………………………………75
8.3实验方法………………………………………………………………………………75
8.4实验过程………………………………………………………………………………76
8.5实验总结………………………………………………………………………………78
思考题…………………………………………………………………………………………78
第9章航班图实验…………………………………………………………………………79
9.1实验目标………………………………………………………………………………79
9.2实验环境………………………………………………………………………………79
9.3实验方法………………………………………………………………………………79
9.4实验过程………………………………………………………………………………80
9.5实验总结………………………………………………………………………………89
思考题…………………………………………………………………………………………89
第10章自然语言处理实验…………………………………………………………………90
10.1实验目标………………………………………………………………………………90
10.2实验环境………………………………………………………………………………90
10.3实验方法………………………………………………………………………………91
10.4实验过程………………………………………………………………………………92
10.5实验总结………………………………………………………………………………96
思考题…………………………………………………………………………………………96
第11章扩展:深度主题模型………………………………………………………………97
11.1词嵌入…………………………………………………………………………………97
11.2主题模型……………………………………………………………………………116
11.3嵌入式主题模型……………………………………………………………………120
参考文献………………………………………………………………………………………128
第1章大数据技术概述………………………………………………………………………2
1.1大数据概念及特征………………………………………………………………………2
1.2大数据的数据处理流程…………………………………………………………………3
1.3大数据的数据安全………………………………………………………………………6
思考题…………………………………………………………………………………………7
第2章实验相关组件介绍……………………………………………………………………8
2.1HDFS……………………………………………………………………………………8
2.2MapReduce………………………………………………………………………………11
2.3Hive……………………………………………………………………………………15
2.4HBase……………………………………………………………………………………16
2.5Storm……………………………………………………………………………………17
2.6Flume……………………………………………………………………………………18
2.7Kafka……………………………………………………………………………………19
2.8Spark……………………………………………………………………………………21
思考题…………………………………………………………………………………………27
第二部分典型案例实验
第3章销售信息查询实验…………………………………………………………………29
3.1实验目标………………………………………………………………………………29
3.2实验环境………………………………………………………………………………29
3.3实验方法………………………………………………………………………………30
3.4实验过程………………………………………………………………………………31
3.5实验总结………………………………………………………………………………40
思考题…………………………………………………………………………………………40
第4章气象数据探索性分析实验…………………………………………………………41
4.1实验目标………………………………………………………………………………41
4.2实验环境………………………………………………………………………………41
4.3实验方法………………………………………………………………………………42
4.4实验过程………………………………………………………………………………432
4.5实验总结………………………………………………………………………………47
思考题…………………………………………………………………………………………47
第5章地震数据分析实验…………………………………………………………………48
5.1实验目标…………………………………………………………………………………48
5.2实验环境………………………………………………………………………………48
5.3实验方法………………………………………………………………………………49
5.4实验过程………………………………………………………………………………50
5.5实验总结………………………………………………………………………………56
思考题…………………………………………………………………………………………56
第6章信用卡逾期预测实验………………………………………………………………57
6.1实验目标………………………………………………………………………………57
6.2实验环境………………………………………………………………………………57
6.3实验方法………………………………………………………………………………57
6.4实验过程………………………………………………………………………………58
思考题…………………………………………………………………………………………65
第7章电影推荐实验………………………………………………………………………66
7.1实验目标………………………………………………………………………………66
7.2实验环境………………………………………………………………………………66
7.3实验方法………………………………………………………………………………67
7.4实验过程………………………………………………………………………………69
7.5实验总结………………………………………………………………………………74
思考题…………………………………………………………………………………………74
第8章社交网络推荐实验…………………………………………………………………75
8.1实验目标………………………………………………………………………………75
8.2实验环境………………………………………………………………………………75
8.3实验方法………………………………………………………………………………75
8.4实验过程………………………………………………………………………………76
8.5实验总结………………………………………………………………………………78
思考题…………………………………………………………………………………………78
第9章航班图实验…………………………………………………………………………79
9.1实验目标………………………………………………………………………………79
9.2实验环境………………………………………………………………………………79
9.3实验方法………………………………………………………………………………79
9.4实验过程………………………………………………………………………………80
9.5实验总结………………………………………………………………………………89
思考题…………………………………………………………………………………………89
第10章自然语言处理实验…………………………………………………………………90
10.1实验目标………………………………………………………………………………90
10.2实验环境………………………………………………………………………………90
10.3实验方法………………………………………………………………………………91
10.4实验过程………………………………………………………………………………92
10.5实验总结………………………………………………………………………………96
思考题…………………………………………………………………………………………96
第11章扩展:深度主题模型………………………………………………………………97
11.1词嵌入…………………………………………………………………………………97
11.2主题模型……………………………………………………………………………116
11.3嵌入式主题模型……………………………………………………………………120
参考文献………………………………………………………………………………………128














