注册 登录 进入教材巡展
#
  • #

出版时间:2023-12

最新印次日期:2023-12

出版社:中国铁道出版社

河南省“十四五”普通高等教育规划教材

以下为《大数据导论(第二版)》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国铁道出版社
  • 9787113298951
  • 2版
  • 455250
  • 60269844-1
  • 16开
  • 2023-12
  • 工学
  • 计算机类
  • 电子与信息大类
  • 计算机类
  • 计算机类
  • 本科
作者简介
甘勇,郑州工程技术学院副校长,教授,长期工作在教学科研一线,主持的大学计算机和程序设计基础课程被评为河南省精品课程、河南省精品资源共享课,担任教育部计算机课程教学指导委员会委员、河南省计算机类专业和网络空间安全专业教学指导委员会副主任,兼任中国计算机学会理事、河南省计算机学会副理事长、河南省计算机教育研究会副理事长。荣获过国家级优秀教学成果二等奖、2项河南省优秀教学成果特等奖、3项河南省优秀教学成果二等奖。

陶红伟,郑州轻工业大学计算机与通信工程学院副教授、博士,主要研究方向包括大数据分析、软件可信度量与评估、信息安全。主持省部级以及横向项目5项,作为主要成员参与国家863重点项目子课题、国家自然科学基金重大研究计划集成项目子课题、国家863项目和国家自然科学基金项目等。
查看全部
内容简介
为适应大数据时代的需要,许多高校纷纷设立数据科学与大数据专业。本书基于高等院校相应课程的教学要求而编写,详细讲述了大数据与数据科学、数据采集与数据预处理、数据存储、数据处理、数据分析、数据可视化、数据安全与隐私、大数据应用、数据思维等内容。
本书内容注重引导性、前瞻性、经典性、实践性,旨在引导读者进入大数据领域,了解大数据最新技术及其行业应用,关注大数据分析经典算法。书中还设置了实验环境和多个案例,便于读者进行实践操作。
本书适合作为高等院校数据科学与大数据专业及其相近专业教材,也可供从事相关科研和工程技术人员参考。
目录
第1章大数据与数据科学/1
1.1大数据概述/1
1.1.1大数据的概念/2
1.1.2大数据的特征/2
1.1.3大数据的结构类型/3
1.2大数据的发展/4
1.3大数据处理的挑战/5
1.4数据科学的概念/6
1.5数据科学的由来/7
1.6数据科学的应用场景/9
1.6.1行业数据/9
1.6.2数据服务/10
小结/11
习题/11
第2章?数据采集与数据预处理/12
2.1数据采集和数据预处理概述/12
2.1.1数据采集概述/12
2.1.2数据预处理概述/13
2.2数据采集技术/15
2.2.1网络数据采集技术/15
2.2.2日志数据采集技术/23
2.3数据预处理技术/28
2.3.1数据清洗/28
2.3.2数据集成/30
2.3.3数据变换/30
2.3.4数据规约/31
2.3.5电力大数据的采集/32
小结/34
习题/34
第3章?数据存储/35
3.1数据存储概述/35
3.1.1数据存储的发展历程/35
3.1.2数据存储模型/37
3.2关系型数据库/37
3.2.1关系型数据库的基本概念/38
3.2.2关系型数据库的优缺点/40
3.2.3关系型数据库的ACID原则/41
3.2.4关系型数据库分库分表/42
3.3大数据存储/45
3.3.1海量数据存储关键技术/45
3.3.2分布式文件系统/47
3.4分布式数据库/51
3.4.1NoSQL/52
3.4.2CAP理论/53
3.4.3BASE原理/55
3.4.4HBase分布式数据库/57
3.4.5MongoDB分布式数据库/60
3.4.6Hive分布式数据仓库/61
3.4.7图数据库/63
3.4.8内存数据库/66
小结/68
习题/68
第4章?大数据处理平台/69
4.1大数据处理平台概述/69
4.2大数据的处理平台架构/70
4.2.1技术架构/70
4.2.2开源平台/71
4.3大数据的批量计算/73
4.3.1批量计算的概念/73
4.3.2批量计算的软件系统/74
4.4大数据的流式计算/82
4.4.1流式计算的概念/82
4.4.2流式计算的软件系统/83
4.5大数据的混合处理计算/87
4.5.1混合处理计算的概念/87
4.5.2混合处理计算的软件系统/88
小结/97
习题/98
第5章?数据分析/99
5.1数据分析概述/99
5.1.1数据分析的概念和作用/99
5.1.2数据分析的类型/100
5.1.3数据分析的流程/100
5.2统计数据分析方法/102
5.2.1描述统计/102
5.2.2相关分析/103
5.2.3回归分析/107
5.2.4主成分分析/111
5.3数据挖掘算法/115
5.3.1决策树/115
5.3.2?随机森林算法/120
5.3.3K-Means算法/123
5.3.4Apriori算法/128
5.3.5神经网络/133
5.4数据分析工具/135
5.5?电力大数据分析/136
5.5.1?基于电力大数据分析的反窃电预
??测方法/136
5.5.2?基于电力大数据分析的电费风险
??预警模型构建方法/151
小结/160
习题/160
第6章?数据可视化/162
6.1数据可视化概述/162
6.1.1数据可视化的概念/162
6.1.2数据可视化的作用/163
6.1.3数据可视化的一般过程/164
6.1.4?数据可视化的原则/165
6.1.5?数据可视化的挑战和趋势/167
6.1.6?常用数据可视化的图类型/168
6.2数据可视化方法/172
6.2.1文本可视化/172
6.2.2网络可视化/174
6.2.3时空数据可视化/177
6.3数据可视化常用工具/179
6.3.1Excel/179
6.3.2ECharts/180
6.3.3Tableau/180
6.4?数据可视化常用编程语言/181
6.4.1?Python/181
6.4.2?D3.js/181
6.4.3?R/182
6.4.4?HTML、JavaScript和CSS语言/182
小结/183
习题/183
第7章?大数据安全与隐私保护/184
7.1大数据安全概述/184
7.2大数据安全体系结构/193
7.3大数据安全技术/197
7.4大数据安全协议/204
7.5大数据隐私保护/207
7.5.1?大数据时代隐私侵权特征/207
7.5.2?国内外隐私保护现状/208
7.5.3?大数时代隐私保护关键技术/210
7.6?大数据共享与隐私保护/214
7.6.1?大数据共享安全框架/215
7.6.2?联邦学习/219
小结/221
习题/222
第8章?大数据应用/223
8.1互联网商业应用/223
8.1.1用户画像/223
8.1.2大数据精准营销/226
8.1.3互联网金融/227
8.2行业大数据/229
8.2.1教育大数据/229
8.2.2电力大数据/231
8.2.3医疗大数据/233
8.3人工智能应用/236
8.3.1语音识别和机器翻译/236
8.3.2共享经济/237
8.3.3智慧城市/240
小结/244
习题/244
第9章?数据思维/245
9.1大数据时代的挑战/245
9.2大数据时代的思维变革/249
9.2.1第四范式/249
9.2.2数据的混杂性/250
9.2.3样本与总体/251
9.2.4数据的相关关系与因果
???关系/252
9.2.5大数据与幸存者偏差/253
9.3大数据激发创造力/255
9.3.1大数据预测电影票房/255
9.3.2利用大数据发掘商业价值/256
9.3.3利用大数据发现高速公路
???超速者/256
9.4数据科学发展/257
9.4.1开放数据运动/257
9.4.2数据科学家所需的专业技能/259
9.4.3数据科学的发展前景/262
小结/263
习题/263
参考文献/264