Python数据分析 / 普通高等院校应用型人才培养十三五规划教材
¥45.00定价
作者: 吴道君,朱家荣
出版时间:2019-09
出版社:中国铁道出版社
- 中国铁道出版社
- 9787113258719
- 1-1
- 403569
- 46229917-3
- 平装
- 16开
- 2019-09
- 322
- 208
- 工学
- 计算机科学与技术
- 计算机基础
- 本科
内容简介
本书以程序设计为主线,以编程应用为驱动,理论联系实际,通过丰富的实例分析详细地介绍了C程序设计的思想及方法。全书叙述严谨、实例丰富、由浅及深、重点突出。全书共8章,内容包括C程序设计入门,数据类型、运算符和表达式,算法与程序设计基础,函数,数组类型与指针类型,结构类型与联合类型,文件,面向对象技术与C++,为读者在学完C语言之后向C++过渡提供了帮助。为避免在学习过程中枯燥乏味,书中精选了一些实用性强、趣味性足的实例,增强了全书的可读性和学生的参与性,便于学生在轻松愉快的气氛中学习。本书适合作为高等院校各专业C语言程序设计课程的教材,也可作为广大编程爱好者的自学读物,还可作为各类计算机等级考试的辅导书。"
目录
第1章 Python数据分析概述 1
1.1 数据分析的概念、流程和应用 1
1.1.1 数据分析的概念 1
1.1.2 数据分析的流程 2
1.1.3 数据分析的应用 2
1.2 数据分析工具 3
1.2.1 常用工具 4
1.2.2 Python数据分析 4
1.3 Python数据分析环境 5
小结 9
习题 9
实验 10
第2章 NumPy数值计算 15
2.1 NumPy多维数组 15
2.1.1 数组创建 15
2.1.2 数组对象属性 22
2.1.3 数组数据类型 23
2.2 数组操作 24
2.2.1 修改数组形状 24
2.2.2 翻转数组 26
2.2.3 连接数组 27
2.2.4 分割数组 28
2.2.5 数组元素添加与删除 30
2.3 数组索引与切片 32
2.3.1 数组索引 32
2.3.2 数组切片 33
2.3.3 布尔型索引 34
2.3.4 花式索引 35
2.4 数组的运算 35
2.4.1 数组和标量间的运算 35
2.4.2 广播 36
2.4.3 算术函数 37
2.4.4 集合运算 40
2.4.5 统计运算 41
2.4.6 排序 43
2.4.7 搜索 44
2.5 线性代数 45
2.5.1 数组相乘 46
2.5.2 矩阵行列式 46
2.5.3 逆矩阵 46
2.5.4 线性方程组 47
2.5.5 特征值和特征向量 47
2.6 数组的存取 48
小结 48
习题 48
实验 51
第3章 Matplotlib数据可视化 54
3.1 线形图 54
3.1.1 绘制线形图 54
3.1.2 颜色设置 55
3.1.3 线型设置 56
3.1.4 坐标点设置 57
3.1.5 线宽设置 59
3.2 其他图形 59
3.2.1 散点图 59
3.2.2 柱形图 61
3.2.3 条形图 63
3.2.4 饼图 64
3.2.5 直方图 65
3.2.6 箱线图 67
3.3 自定义设置 69
3.3.1 图例设置 69
3.3.2 坐标网格设置 70
3.3.3 坐标系设置 71
3.3.4 样式设置与注解 72
3.3.5 RC设置 73
3.4 子图 74
3.4.1 创建子图 74
3.4.2 子图坐标系设置 76
3.4.3 图形嵌套 77
3.5 绘制三维图形 78
小结 81
习题 82
实验 82
第4章 Pandas数据分析 89
4.1 Pandas数据结构 89
4.2 DataFrame基本功能 94
4.3 读取外部数据 95
4.3.1 CSV文件 96
4.3.2 Sqlite数据库 98
4.4 数据帧的列操作和行操作 99
4.4.1 列操作 99
4.4.2 行操作 101
4.5 高级索引 103
4.5.1 重建索引 103
4.5.2 更换索引 106
4.5.3 层次化索引 107
4.6 Pandas数据运算 108
4.6.1 算术运算 108
4.6.2 函数应用与映射运算 109
4.6.3 排序 111
4.6.4 迭代 113
4.6.5 唯一值与值计数 115
4.7 统计函数 116
4.7.1 描述性统计 116
4.7.2 变化率 119
4.7.3 协方差 120
4.7.4 相关性 120
4.7.5 数据排名 121
4.8 分组与聚合 122
4.8.1 分组 122
4.8.2 聚合 124
4.9 透视表与交叉表 127
4.9.1 透视表 127
4.9.2 交叉表 128
小结 129
习题 129
实验 129
第5章 数据预处理 134
5.1 数据清洗 134
5.1.1 重复值 134
5.1.2 缺失值 135
5.1.3 异常值 140
5.2 合并连接与重塑 142
5.2.1 merge合并 142
5.2.2 concat合并 144
5.2.3 combine_first合并 146
5.2.4 数据重塑 147
5.3 数据变换 149
5.3.1 虚拟变量 149
5.3.2 函数变换 150
5.3.3 连续属性离散化 151
5.3.4 规范化 152
5.3.5 随机采样 154
小结 156
习题 156
实验 156
第6章 Sklearn机器学习 162
6.1 术语 162
6.2 Sklearn 164
6.2.1 Sklearn数据集 165
6.2.2 Sklearn常用算法 171
6.2.3 数据预处理 175
6.2.4 数据集拆分 177
6.2.5 模型评估 177
6.2.6 Sklearn常用方法 178
6.2.7 模型的保存和载入 179
6.3 降维 179
6.3.1 PCA(主成分分析) 179
6.3.2 LDA(线性评价分析) 181
6.4 回归 182
6.4.1 线性回归 183
6.4.2 逻辑回归 184
6.4.3 回归决策树 185
6.5 分类 186
6.5.1 朴素贝叶斯 187
6.5.2 分类决策树 188
6.5.3 SVM(支持向量机) 189
6.5.4 神经网络 190
6.5.5 K近邻算法 191
6.6 聚类 192
6.6.1 Kmeans算法 193
6.2.2 DBSCAN 194
小结 195
习题 195
实验 196
参考文献 200
1.1 数据分析的概念、流程和应用 1
1.1.1 数据分析的概念 1
1.1.2 数据分析的流程 2
1.1.3 数据分析的应用 2
1.2 数据分析工具 3
1.2.1 常用工具 4
1.2.2 Python数据分析 4
1.3 Python数据分析环境 5
小结 9
习题 9
实验 10
第2章 NumPy数值计算 15
2.1 NumPy多维数组 15
2.1.1 数组创建 15
2.1.2 数组对象属性 22
2.1.3 数组数据类型 23
2.2 数组操作 24
2.2.1 修改数组形状 24
2.2.2 翻转数组 26
2.2.3 连接数组 27
2.2.4 分割数组 28
2.2.5 数组元素添加与删除 30
2.3 数组索引与切片 32
2.3.1 数组索引 32
2.3.2 数组切片 33
2.3.3 布尔型索引 34
2.3.4 花式索引 35
2.4 数组的运算 35
2.4.1 数组和标量间的运算 35
2.4.2 广播 36
2.4.3 算术函数 37
2.4.4 集合运算 40
2.4.5 统计运算 41
2.4.6 排序 43
2.4.7 搜索 44
2.5 线性代数 45
2.5.1 数组相乘 46
2.5.2 矩阵行列式 46
2.5.3 逆矩阵 46
2.5.4 线性方程组 47
2.5.5 特征值和特征向量 47
2.6 数组的存取 48
小结 48
习题 48
实验 51
第3章 Matplotlib数据可视化 54
3.1 线形图 54
3.1.1 绘制线形图 54
3.1.2 颜色设置 55
3.1.3 线型设置 56
3.1.4 坐标点设置 57
3.1.5 线宽设置 59
3.2 其他图形 59
3.2.1 散点图 59
3.2.2 柱形图 61
3.2.3 条形图 63
3.2.4 饼图 64
3.2.5 直方图 65
3.2.6 箱线图 67
3.3 自定义设置 69
3.3.1 图例设置 69
3.3.2 坐标网格设置 70
3.3.3 坐标系设置 71
3.3.4 样式设置与注解 72
3.3.5 RC设置 73
3.4 子图 74
3.4.1 创建子图 74
3.4.2 子图坐标系设置 76
3.4.3 图形嵌套 77
3.5 绘制三维图形 78
小结 81
习题 82
实验 82
第4章 Pandas数据分析 89
4.1 Pandas数据结构 89
4.2 DataFrame基本功能 94
4.3 读取外部数据 95
4.3.1 CSV文件 96
4.3.2 Sqlite数据库 98
4.4 数据帧的列操作和行操作 99
4.4.1 列操作 99
4.4.2 行操作 101
4.5 高级索引 103
4.5.1 重建索引 103
4.5.2 更换索引 106
4.5.3 层次化索引 107
4.6 Pandas数据运算 108
4.6.1 算术运算 108
4.6.2 函数应用与映射运算 109
4.6.3 排序 111
4.6.4 迭代 113
4.6.5 唯一值与值计数 115
4.7 统计函数 116
4.7.1 描述性统计 116
4.7.2 变化率 119
4.7.3 协方差 120
4.7.4 相关性 120
4.7.5 数据排名 121
4.8 分组与聚合 122
4.8.1 分组 122
4.8.2 聚合 124
4.9 透视表与交叉表 127
4.9.1 透视表 127
4.9.2 交叉表 128
小结 129
习题 129
实验 129
第5章 数据预处理 134
5.1 数据清洗 134
5.1.1 重复值 134
5.1.2 缺失值 135
5.1.3 异常值 140
5.2 合并连接与重塑 142
5.2.1 merge合并 142
5.2.2 concat合并 144
5.2.3 combine_first合并 146
5.2.4 数据重塑 147
5.3 数据变换 149
5.3.1 虚拟变量 149
5.3.2 函数变换 150
5.3.3 连续属性离散化 151
5.3.4 规范化 152
5.3.5 随机采样 154
小结 156
习题 156
实验 156
第6章 Sklearn机器学习 162
6.1 术语 162
6.2 Sklearn 164
6.2.1 Sklearn数据集 165
6.2.2 Sklearn常用算法 171
6.2.3 数据预处理 175
6.2.4 数据集拆分 177
6.2.5 模型评估 177
6.2.6 Sklearn常用方法 178
6.2.7 模型的保存和载入 179
6.3 降维 179
6.3.1 PCA(主成分分析) 179
6.3.2 LDA(线性评价分析) 181
6.4 回归 182
6.4.1 线性回归 183
6.4.2 逻辑回归 184
6.4.3 回归决策树 185
6.5 分类 186
6.5.1 朴素贝叶斯 187
6.5.2 分类决策树 188
6.5.3 SVM(支持向量机) 189
6.5.4 神经网络 190
6.5.5 K近邻算法 191
6.6 聚类 192
6.6.1 Kmeans算法 193
6.2.2 DBSCAN 194
小结 195
习题 195
实验 196
参考文献 200