Python大数据分析 / 新形态一体化应用型人才培养“十四五”系列教材
¥49.80定价
作者: 吴道君,沈阳,陈素霞
出版时间:2024-02
出版社:中国铁道出版社
- 中国铁道出版社
- 9787113191825
- 1版
- 521458
- 48256951-4
- 16开
- 2024-02
- 计算机及相关专业
- 本科 高职
作者简介
内容简介
本书为新形态一体化应用型人才培养“十四五”系列教材之一,全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。
本书内容充实、结构合理、实用性强,具有明显的应用能力培养特色。学完本书后,读者可具备数据分析的基本能力。
本书适合作为普通高等院校人工智能、数据科学与大数据以及计算机相关专业课程的教材,也可以作为相关从业人员的技术参考书。
本书内容充实、结构合理、实用性强,具有明显的应用能力培养特色。学完本书后,读者可具备数据分析的基本能力。
本书适合作为普通高等院校人工智能、数据科学与大数据以及计算机相关专业课程的教材,也可以作为相关从业人员的技术参考书。
目录
第1章Python数据分析概述1
1.1数据分析的概念、流程和应用1
1.1.1数据分析的概念1
1.1.2数据分析的流程2
1.1.3数据分析的应用2
1.2数据分析工具3
1.2.1常用工具4
1.2.2Python数据分析4
1.3Python数据分析环境5
小结15
习题15
实验16
第2章NumPy数值计算21
2.1NumPy多维数组21
2.1.1数组创建21
2.1.2数组对象属性28
2.1.3数组数据类型29
2.2数组操作30
2.2.1修改数组形状30
2.2.2翻转数组32
2.2.3连接数组33
2.2.4分割数组34
2.2.5数组元素添加与删除36
2.3数组索引与切片38
2.3.1数组索引38
2.3.2数组切片39
2.3.3布尔型索引40
2.3.4花式索引41
2.4数组的运算42
2.4.1数组和标量间的运算42
2.4.2广播42
2.4.3算术函数43
2.4.4集合运算46
2.4.5统计运算48
2.4.6排序49
2.4.7搜索51
2.5线性代数.52
2.5.1数组相乘52
2.5.2矩阵行列式53
2.5.3逆矩阵53
2.5.4线性方程组53
2.5.5特征值和特征向量54
2.6数组的存取54
2.7视图和副本55
2.8随机漫步56
小结57
习题57
实验59
第3章Matplotlib数据可视化63
3.1折线图63
3.1.1折线图函数概述63
3.1.2折线图绘制示例65
3.2图表属性设置.66
3.2.1图表属性概述66
3.2.2图例和rc设置67
3.2.3坐标网格设置68
3.2.4坐标系设置69
3.2.5文本注解70
3.3其他图形72
3.3.1散点图72
3.3.2垂直柱形图73
3.3.3水平柱形图75
3.3.4饼图77
3.3.5直方图78
3.3.6箱线图81
3.4子图84
3.4.1创建子图84
3.4.2子图坐标系设置87
3.4.3图形嵌套88
3.5绘制三维图形.90
3.5.1三维曲线图90
3.5.2三维散点图91
3.5.3曲面图92
3.5.4等高线93
小结96
习题96
实验97
第4章Pandas数据分析.99
4.1Pandas数据结构.99
4.2DataFrame基本功能105
4.3读取外部数据.107
4.3.1CSV文件107
4.3.2Sqlite数据库111
4.3.3读取外部数据-拓展112
4.4数据帧的列操作和行操作112
4.4.1列操作112
4.4.2行操作113
4.5高级索引.116
4.5.1重建索引116
4.5.2更换索引118
4.5.3层次化索引120
4.6Pandas数据运算.121
4.6.1算术运算121
4.6.2函数应用与映射运算122
4.6.3排序124
4.6.4迭代125
4.6.5唯一值与值计数128
4.7统计函数129
4.7.1描述性统计129
4.7.2变化率132
4.7.3协方差133
4.7.4相关性133
4.7.5数据排名134
4.8分组与聚合135
4.8.1分组135
4.8.2聚合137
4.9透视表与交叉表140
4.9.1透视表140
4.9.2交叉表141
小结143
习题143
实验143
第5章数据预处理148
5.1数据清洗.148
5.1.1重复值148
5.1.2缺失值149
5.1.3异常值155
5.2合并连接与重塑.156
5.2.1merge合并156
5.2.2concat合并159
5.2.3combine_first合并.161
5.2.4数据重塑162
5.3数据变换.164
5.3.1虚拟变量164
5.3.2函数变换164
5.3.3连续属性离散化165
5.3.4规范化167
5.3.5随机采样168
小结170
习题170
实验171
第6章Sklearn机器学习177
6.1术语177
6.2Sklearn179
6.2.1Sklearn数据集180
6.2.2Sklearn常用算法186
6.2.3数据预处理190
6.2.4数据集拆分192
6.2.5模型评估193
6.2.6Sklearn常用方法194
6.2.7模型的保存和载入194
6.3降维.194
6.3.1PCA(主成分分析).194
6.3.2LDA(线性评价分析).196
6.4回归197
6.4.1线性回归198
Python大数据分析
III6.4.2逻辑回归.199
6.4.3回归决策树200
6.5分类.202
6.5.1朴素贝叶斯分类202
6.5.2分类决策树204
6.5.3SVM(支持向量机)204
6.5.4神经网络205
6.5.5k-近邻算法206
6.6聚类207
6.6.1K-means算法208
6.6.2DBSCAN209
小结210
习题210
实验211
1.1数据分析的概念、流程和应用1
1.1.1数据分析的概念1
1.1.2数据分析的流程2
1.1.3数据分析的应用2
1.2数据分析工具3
1.2.1常用工具4
1.2.2Python数据分析4
1.3Python数据分析环境5
小结15
习题15
实验16
第2章NumPy数值计算21
2.1NumPy多维数组21
2.1.1数组创建21
2.1.2数组对象属性28
2.1.3数组数据类型29
2.2数组操作30
2.2.1修改数组形状30
2.2.2翻转数组32
2.2.3连接数组33
2.2.4分割数组34
2.2.5数组元素添加与删除36
2.3数组索引与切片38
2.3.1数组索引38
2.3.2数组切片39
2.3.3布尔型索引40
2.3.4花式索引41
2.4数组的运算42
2.4.1数组和标量间的运算42
2.4.2广播42
2.4.3算术函数43
2.4.4集合运算46
2.4.5统计运算48
2.4.6排序49
2.4.7搜索51
2.5线性代数.52
2.5.1数组相乘52
2.5.2矩阵行列式53
2.5.3逆矩阵53
2.5.4线性方程组53
2.5.5特征值和特征向量54
2.6数组的存取54
2.7视图和副本55
2.8随机漫步56
小结57
习题57
实验59
第3章Matplotlib数据可视化63
3.1折线图63
3.1.1折线图函数概述63
3.1.2折线图绘制示例65
3.2图表属性设置.66
3.2.1图表属性概述66
3.2.2图例和rc设置67
3.2.3坐标网格设置68
3.2.4坐标系设置69
3.2.5文本注解70
3.3其他图形72
3.3.1散点图72
3.3.2垂直柱形图73
3.3.3水平柱形图75
3.3.4饼图77
3.3.5直方图78
3.3.6箱线图81
3.4子图84
3.4.1创建子图84
3.4.2子图坐标系设置87
3.4.3图形嵌套88
3.5绘制三维图形.90
3.5.1三维曲线图90
3.5.2三维散点图91
3.5.3曲面图92
3.5.4等高线93
小结96
习题96
实验97
第4章Pandas数据分析.99
4.1Pandas数据结构.99
4.2DataFrame基本功能105
4.3读取外部数据.107
4.3.1CSV文件107
4.3.2Sqlite数据库111
4.3.3读取外部数据-拓展112
4.4数据帧的列操作和行操作112
4.4.1列操作112
4.4.2行操作113
4.5高级索引.116
4.5.1重建索引116
4.5.2更换索引118
4.5.3层次化索引120
4.6Pandas数据运算.121
4.6.1算术运算121
4.6.2函数应用与映射运算122
4.6.3排序124
4.6.4迭代125
4.6.5唯一值与值计数128
4.7统计函数129
4.7.1描述性统计129
4.7.2变化率132
4.7.3协方差133
4.7.4相关性133
4.7.5数据排名134
4.8分组与聚合135
4.8.1分组135
4.8.2聚合137
4.9透视表与交叉表140
4.9.1透视表140
4.9.2交叉表141
小结143
习题143
实验143
第5章数据预处理148
5.1数据清洗.148
5.1.1重复值148
5.1.2缺失值149
5.1.3异常值155
5.2合并连接与重塑.156
5.2.1merge合并156
5.2.2concat合并159
5.2.3combine_first合并.161
5.2.4数据重塑162
5.3数据变换.164
5.3.1虚拟变量164
5.3.2函数变换164
5.3.3连续属性离散化165
5.3.4规范化167
5.3.5随机采样168
小结170
习题170
实验171
第6章Sklearn机器学习177
6.1术语177
6.2Sklearn179
6.2.1Sklearn数据集180
6.2.2Sklearn常用算法186
6.2.3数据预处理190
6.2.4数据集拆分192
6.2.5模型评估193
6.2.6Sklearn常用方法194
6.2.7模型的保存和载入194
6.3降维.194
6.3.1PCA(主成分分析).194
6.3.2LDA(线性评价分析).196
6.4回归197
6.4.1线性回归198
Python大数据分析
III6.4.2逻辑回归.199
6.4.3回归决策树200
6.5分类.202
6.5.1朴素贝叶斯分类202
6.5.2分类决策树204
6.5.3SVM(支持向量机)204
6.5.4神经网络205
6.5.5k-近邻算法206
6.6聚类207
6.6.1K-means算法208
6.6.2DBSCAN209
小结210
习题210
实验211