Python数据分析 / “十四五”高等学校新工科计算机类专业系列教材
定价:¥69.80
作者: 刘秋菊,王国政,黄继海
出版时间:2023-08
最新印次日期:2023-8
出版社:中国铁道出版社
- 中国铁道出版社
- 9787113304270
- 1版
- 502227
- 60269851-6
- 16开
- 2023-08
- 工学
- 计算机类
- 计算机类
- 本科
作者简介
内容简介
本书按照“‘十四五’高等学校新工科计算机类专业系列教材”总体编写规划的要求而编写,从Python数据分析的基础知识入手,系统地论述数据分析的流程和方法,结合大量的数据分析案例,内容循序渐进,通过完整的实例系统、全面地阐释了Python数据分析的相关知识。
本书共9章,主要包括数据分析与Python基础、NumPy数值计算、Pandas统计分析、数据载入与预处理、数据分析可视化、数据分析方法、时间序列数据分析、文本数据分析、图像数据分析等内容,并且按照数据分析的流程对大量实例进行分析。
本书适合作为高等院校智能科学与技术、数据科学与大数据、物联网工程、软件工程和计算机科学与技术等专业的教材,也可作为Python数据分析爱好者的参考书,还可作为各类人工智能技术培训用书。
本书共9章,主要包括数据分析与Python基础、NumPy数值计算、Pandas统计分析、数据载入与预处理、数据分析可视化、数据分析方法、时间序列数据分析、文本数据分析、图像数据分析等内容,并且按照数据分析的流程对大量实例进行分析。
本书适合作为高等院校智能科学与技术、数据科学与大数据、物联网工程、软件工程和计算机科学与技术等专业的教材,也可作为Python数据分析爱好者的参考书,还可作为各类人工智能技术培训用书。
目录
第一部分 Python数据分析基础
第1章 数据分析与Python基础.2
1.1数据分析基础2
1.1.1什么是数据分析.2
1.1.2数据分析流程.5
1.1.3数据分析的发展.6
1.2常用Python数据分析环境搭建.6
1.2.1在Windows下安装Anaconda.6
1.2.2JupyterNotebook的安装与启动12
1.2.3JupyterNotebook的基本使用12
1.3Python编程基础14
1.3.1数据类型及其转换.14
1.3.2函数.21
1.4案例分析与实训22
1.4.1Python做数学问题.22
1.4.2Python做文字处理.24
1.4.3Python做逻辑流程控制.25
1.4.4Python做基本数据统计.26
习题.28
第2章 NumPy数值计算31
2.1NumPy多维数组.31
2.1.1NumPy数组创建32
2.1.2Numpy数组对象属性和数据转换.34
2.1.3生成随机数.36
2.2数组的索引和切片37
2.2.1一维数组的索引和切片.37
2.2.2多维数组的索引和切片.38
2.2.3花式索引.40
2.3数组的重构41
2.3.1数组的变形.41
2.3.2数组的拼接.44
2.3.3数组的分裂.46
2.4数组的运算46
2.4.1数组和标量间的运算.46
2.4.2通用函数.47
2.4.3条件逻辑运算.49
2.4.4广播机制.50
2.4.5数组的比较和布尔数组.52
2.5数组读/写.54
2.5.1读/写二进制文件54
2.5.2读/写文本文件55
2.5.3读/写CSV文件55
2.6NumPy中的数据统计与分析.56
2.6.1排序.56
2.6.2重复数据与去重.57
2.6.3常用统计函数.58
2.7案例分析与实训.59
习题.63
第3章 Pandas统计分析.65
3.1Pandas中的数据结构.65
3.1.1Series65
3.1.2DataFrame.69
3.1.3索引对象.73
3.2Pandas索引操作.74
3.2.1重建索引.74
3.2.2更换索引.76
3.3DataFrame数据的查询与编辑.76
3.3.1DataFrame数据的查询.76
3.3.2DataFrame数据的编辑.79
3.4Pandas数据运算.81
3.4.1算术运算.81
3.4.2函数应用和映射.82
3.4.3排序.83
3.4.4汇总与统计.85
3.5层次化索引.87
3.5.1基本创建.87
3.5.2重排分级排序.88
3.5.3根据级别汇总统计.89
3.5.4DataFrame数据列的使用.90
3.6数据分组与聚合91
3.6.1数据分组.91
3.6.2数据聚合.96
3.6.3分组运算.97
3.7数据透视表98
3.7.1透视表.98
3.7.2交叉表.99
3.8案例分析与实训.100
习题.105
第二部分 数据分析流程及相关技术
第4章 数据载入与预处理.110
4.1数据载入110
4.1.1文本类文件.110
4.1.2Excel文件.112
4.1.3网络数据获取.113
4.2数据合并与重塑.120
4.2.1merge数据合并.120
4.2.2concat数据连接.123
4.2.3combine_first合并数据.125
4.2.4数据重塑.125
4.3数据清洗.131
4.3.1空值与缺失值的处理.131
4.3.2检测与处理重复值.135
4.3.3检测与处理异常值.137
4.3.4更改数据类型.138
4.4数据标准化140
4.4.1离差标准化数据.140
4.4.2标准差标准化数据.141
4.4.3小数定标标准化.142
4.5数据转换142
4.5.1类别型数据的哑变量处理.143
4.5.2连续型变量的离散化.143
4.6特征工程与特征降维145
4.6.1特征工程.145
4.6.2特征降维.145
4.7案例分析与实训150
习题.156
第5章 数据分析可视化159
5.1Matplotlib可视化基础159
5.1.1Matplotlib三层次接口.160
5.1.2创建画布与子图.160
5.1.3添加画布内容.163
5.1.4绘图的保存与显示.165
5.1.5设置Pyplot的动态rc参数165
5.2常见图表类型172
5.2.1折线图.172
5.2.2条形图.173
5.2.3直方图.173
5.2.4散点图.174
5.2.5箱线图.175
5.2.6饼图.176
5.2.7概率图.177
5.3Seaborn可视化177
5.3.1关系类图的绘制.178
5.3.2分布图的绘制.179
5.3.3分类图的绘制.184
5.3.4回归图的绘制.186
5.3.5热力图的绘制.188
5.4Pyecharts可视化189
5.4.1基本配置.189
5.4.2常见图表绘制.189
5.5案例分析与实训194
习题.205
第6章 数据分析方法.206
6.1描述性统计分析207
6.1.1集中趋势分析.207
6.1.2离散程度分析.208
6.1.3数据分布形态.211
6.2回归分析法212
6.2.1线性回归.212
6.2.2多项式回归.216
6.3分类分析法219
6.3.1K近邻算法.219
6.3.2逻辑回归.224
6.3.3决策树与随机森林.228
6.3.4朴素贝叶斯分类.234
6.4聚类分析法237
6.4.1K均值聚类算法.239
6.4.2DBSCAN聚类244
6.5人工神经网络与深度学习248
6.5.1人工神经网络.248
6.5.2深度学习.250
6.6案例分析与实训253
习题.259
第7章 时间序列数据分析260
7.1时间对象——Timestamp261
7.1.1创建时间戳.261
7.1.2最大时间/最小时间262
7.1.3常用属性.262
7.2时期对象——Period263
7.2.1创建Period对象.263
7.2.2Period对象的属性264
7.2.3Period对象的方法264
7.3时间间隔对象——Timedelta266
7.3.1创建Timedelta对象.266
7.3.2Timedelta的属性操作267
7.3.3Timedelta的基本方法267
7.3.4时间间隔的基本运算.268
7.4时间索引269
7.4.1时间序列.269
7.4.2有规律的时间序列.270
7.5重采样及频率转换271
7.5.1重采样方法.272
7.5.2降采样.273
7.5.3升采样.273
7.6时序模型——ARIMA.274
7.7案例分析与实训——股票价格预测分析.275
习题.282
第8章 文本数据分析.283
8.1文本数据分析概述283
8.1.1文本处理工具——NLTK与Jieba.283
8.1.2文本预处理的流程.284
8.2使用Jieba处理文本285
8.2.1Jieba的安装285
8.2.2Jieba的应用286
8.3使用NLTK处理文本290
8.3.1NLTK的安装290
8.3.2NLTK的应用291
8.4文本相似度294
8.4.1相似度分析.294
8.4.2基于NLTK的文本相似度分析295
8.4.3基于Gensim的文本相似度分析.296
8.5文本情感分析299
8.5.1文本情感分析概述.299
8.5.2基于朴素贝叶斯的分析.300
8.5.3基于情感词典的分析.301
8.6文本分类302
8.7案例分析与实训——新闻栏目分类.304
习题.312
第9章 图像数据分析.314
9.1图像的本质315
9.1.1图像常用库和工具.315
9.1.2图像的基本分类.316
9.1.3图像载入与显示.320
9.2常见图像处理方法323
9.2.1直方图均衡.323
9.2.2图像空间滤波处理.328
9.2.3仿射变换.331
9.3案例分析与实训334
习题.338
参考文献
第1章 数据分析与Python基础.2
1.1数据分析基础2
1.1.1什么是数据分析.2
1.1.2数据分析流程.5
1.1.3数据分析的发展.6
1.2常用Python数据分析环境搭建.6
1.2.1在Windows下安装Anaconda.6
1.2.2JupyterNotebook的安装与启动12
1.2.3JupyterNotebook的基本使用12
1.3Python编程基础14
1.3.1数据类型及其转换.14
1.3.2函数.21
1.4案例分析与实训22
1.4.1Python做数学问题.22
1.4.2Python做文字处理.24
1.4.3Python做逻辑流程控制.25
1.4.4Python做基本数据统计.26
习题.28
第2章 NumPy数值计算31
2.1NumPy多维数组.31
2.1.1NumPy数组创建32
2.1.2Numpy数组对象属性和数据转换.34
2.1.3生成随机数.36
2.2数组的索引和切片37
2.2.1一维数组的索引和切片.37
2.2.2多维数组的索引和切片.38
2.2.3花式索引.40
2.3数组的重构41
2.3.1数组的变形.41
2.3.2数组的拼接.44
2.3.3数组的分裂.46
2.4数组的运算46
2.4.1数组和标量间的运算.46
2.4.2通用函数.47
2.4.3条件逻辑运算.49
2.4.4广播机制.50
2.4.5数组的比较和布尔数组.52
2.5数组读/写.54
2.5.1读/写二进制文件54
2.5.2读/写文本文件55
2.5.3读/写CSV文件55
2.6NumPy中的数据统计与分析.56
2.6.1排序.56
2.6.2重复数据与去重.57
2.6.3常用统计函数.58
2.7案例分析与实训.59
习题.63
第3章 Pandas统计分析.65
3.1Pandas中的数据结构.65
3.1.1Series65
3.1.2DataFrame.69
3.1.3索引对象.73
3.2Pandas索引操作.74
3.2.1重建索引.74
3.2.2更换索引.76
3.3DataFrame数据的查询与编辑.76
3.3.1DataFrame数据的查询.76
3.3.2DataFrame数据的编辑.79
3.4Pandas数据运算.81
3.4.1算术运算.81
3.4.2函数应用和映射.82
3.4.3排序.83
3.4.4汇总与统计.85
3.5层次化索引.87
3.5.1基本创建.87
3.5.2重排分级排序.88
3.5.3根据级别汇总统计.89
3.5.4DataFrame数据列的使用.90
3.6数据分组与聚合91
3.6.1数据分组.91
3.6.2数据聚合.96
3.6.3分组运算.97
3.7数据透视表98
3.7.1透视表.98
3.7.2交叉表.99
3.8案例分析与实训.100
习题.105
第二部分 数据分析流程及相关技术
第4章 数据载入与预处理.110
4.1数据载入110
4.1.1文本类文件.110
4.1.2Excel文件.112
4.1.3网络数据获取.113
4.2数据合并与重塑.120
4.2.1merge数据合并.120
4.2.2concat数据连接.123
4.2.3combine_first合并数据.125
4.2.4数据重塑.125
4.3数据清洗.131
4.3.1空值与缺失值的处理.131
4.3.2检测与处理重复值.135
4.3.3检测与处理异常值.137
4.3.4更改数据类型.138
4.4数据标准化140
4.4.1离差标准化数据.140
4.4.2标准差标准化数据.141
4.4.3小数定标标准化.142
4.5数据转换142
4.5.1类别型数据的哑变量处理.143
4.5.2连续型变量的离散化.143
4.6特征工程与特征降维145
4.6.1特征工程.145
4.6.2特征降维.145
4.7案例分析与实训150
习题.156
第5章 数据分析可视化159
5.1Matplotlib可视化基础159
5.1.1Matplotlib三层次接口.160
5.1.2创建画布与子图.160
5.1.3添加画布内容.163
5.1.4绘图的保存与显示.165
5.1.5设置Pyplot的动态rc参数165
5.2常见图表类型172
5.2.1折线图.172
5.2.2条形图.173
5.2.3直方图.173
5.2.4散点图.174
5.2.5箱线图.175
5.2.6饼图.176
5.2.7概率图.177
5.3Seaborn可视化177
5.3.1关系类图的绘制.178
5.3.2分布图的绘制.179
5.3.3分类图的绘制.184
5.3.4回归图的绘制.186
5.3.5热力图的绘制.188
5.4Pyecharts可视化189
5.4.1基本配置.189
5.4.2常见图表绘制.189
5.5案例分析与实训194
习题.205
第6章 数据分析方法.206
6.1描述性统计分析207
6.1.1集中趋势分析.207
6.1.2离散程度分析.208
6.1.3数据分布形态.211
6.2回归分析法212
6.2.1线性回归.212
6.2.2多项式回归.216
6.3分类分析法219
6.3.1K近邻算法.219
6.3.2逻辑回归.224
6.3.3决策树与随机森林.228
6.3.4朴素贝叶斯分类.234
6.4聚类分析法237
6.4.1K均值聚类算法.239
6.4.2DBSCAN聚类244
6.5人工神经网络与深度学习248
6.5.1人工神经网络.248
6.5.2深度学习.250
6.6案例分析与实训253
习题.259
第7章 时间序列数据分析260
7.1时间对象——Timestamp261
7.1.1创建时间戳.261
7.1.2最大时间/最小时间262
7.1.3常用属性.262
7.2时期对象——Period263
7.2.1创建Period对象.263
7.2.2Period对象的属性264
7.2.3Period对象的方法264
7.3时间间隔对象——Timedelta266
7.3.1创建Timedelta对象.266
7.3.2Timedelta的属性操作267
7.3.3Timedelta的基本方法267
7.3.4时间间隔的基本运算.268
7.4时间索引269
7.4.1时间序列.269
7.4.2有规律的时间序列.270
7.5重采样及频率转换271
7.5.1重采样方法.272
7.5.2降采样.273
7.5.3升采样.273
7.6时序模型——ARIMA.274
7.7案例分析与实训——股票价格预测分析.275
习题.282
第8章 文本数据分析.283
8.1文本数据分析概述283
8.1.1文本处理工具——NLTK与Jieba.283
8.1.2文本预处理的流程.284
8.2使用Jieba处理文本285
8.2.1Jieba的安装285
8.2.2Jieba的应用286
8.3使用NLTK处理文本290
8.3.1NLTK的安装290
8.3.2NLTK的应用291
8.4文本相似度294
8.4.1相似度分析.294
8.4.2基于NLTK的文本相似度分析295
8.4.3基于Gensim的文本相似度分析.296
8.5文本情感分析299
8.5.1文本情感分析概述.299
8.5.2基于朴素贝叶斯的分析.300
8.5.3基于情感词典的分析.301
8.6文本分类302
8.7案例分析与实训——新闻栏目分类.304
习题.312
第9章 图像数据分析.314
9.1图像的本质315
9.1.1图像常用库和工具.315
9.1.2图像的基本分类.316
9.1.3图像载入与显示.320
9.2常见图像处理方法323
9.2.1直方图均衡.323
9.2.2图像空间滤波处理.328
9.2.3仿射变换.331
9.3案例分析与实训334
习题.338
参考文献














