Python数据分析原理与应用 / 高等院校数字经济专业创新驱动系列教材
定价:¥89.00
作者: 王华清等
出版时间:2025-11-26
出版社:机械工业出版社
- 机械工业出版社
- 9787111793182
- 1-1
- 563474
- 平装
- 2025-11-26
- 497
内容简介
本书以Python为工具,以“理论为基、实践为用”为宗旨,系统构建从基础到进阶、从工具到场景的数据分析知识体系,旨在帮助读者掌握数据驱动的思维方法,并将其转化为解决实际问题的能力。全书共7章,数据分析概述;数据分析的重要工具:Python;Python数组及矩阵处理:基于NumPy;Python数据可视化:基于Matplotlib;Python数据挖掘:基于Pandas;Python符号计算:基于SymPy;Python科学计算:基于SciPy。
通过本书的学习,读者将掌握数据分析的核心概念、技术与工具,能够运用Python高效处理和分析数据,挖掘有价值的信息以支持决策和创新。同时,也能培养解决实际问题的能力,通过丰富的案例将理论知识应用于商业、科研等领域,积累实践经验。本书可作为高等院校人工智能类专业、大数据管理与应用专业及其他数据分析类专业的教材,也适合数据工程师、科学家、研究人员,以及对数据分析感兴趣的读者阅读。
通过本书的学习,读者将掌握数据分析的核心概念、技术与工具,能够运用Python高效处理和分析数据,挖掘有价值的信息以支持决策和创新。同时,也能培养解决实际问题的能力,通过丰富的案例将理论知识应用于商业、科研等领域,积累实践经验。本书可作为高等院校人工智能类专业、大数据管理与应用专业及其他数据分析类专业的教材,也适合数据工程师、科学家、研究人员,以及对数据分析感兴趣的读者阅读。
目录
目录
前言
第1章 数据分析概述 1
1.1 数据的含义及特征 1
1.1.1 数据的基本含义 1
1.1.2 数据的基本类型 1
1.1.3 数据的基本特征 2
1.2 数据分析思维 3
1.3 数据分析的层次 4
1.4 数据分析的流程与方法 5
1.5 练习题 6
第2章 数据分析的重要工具:
Python 7
2.1 Python数据分析概述 7
2.1.1 Python特点 7
2.1.2 Python与其他数据分析工具的
对比 7
2.1.3 Python数据分析常用库 8
2.2 Python数据分析环境配置 9
2.2.1 Anaconda的安装 9
2.2.2 Anaconda的使用 13
2.3 Python语言基础 15
2.3.1 Python语言中标识符与变量
赋值 15
2.3.2 Python 语言的语法规范 17
2.3.3 Python语言的数据结构 18
2.3.4 Python语言的分支结构 22
2.3.5 Python语言的循环结构 24
2.3.6 Python语言的函数 27
2.3.7 Python语言的类与实例 28
2.4 Jupyter Notebook应用基础 32
2.4.1 Jupyter Notebook的安装与
运行 32
2.4.2 Jupyter Notebook的主界面及
工作目录的设置 34
2.4.3 Jupyter Notebook主界面功能
介绍 35
2.4.4 Jupyter Notebook编辑界面功能
介绍 36
2.4.5 魔法命令的使用 37
2.5 练习题 38
第3章 Python数组及矩阵处理:
基于NumPy 40
3.1 NumPy简介 40
3.2 建立数组 41
3.2.1 什么是数组 41
3.2.2 数据的类型 42
3.2.3 数组的创建 43
3.2.4 数组的属性 48
3.2.5 数组的复制 50
3.2.6 数组的存取 51
3.3 数组操作 57
3.3.1 数组的变形 57
3.3.2 数组的拼接 59
3.3.3 数组的分割 62
3.3.4 数组的索引 64
3.3.5 数组的切片 66
3.3.6 替换数组值 68
3.3.7 删除行或列 71
3.3.8 插入行或列 72
3.4 数组运算 74
3.4.1 数组的广播原理 74
3.4.2 数组的四则运算 77
3.4.3 数组的复合运算 79
3.4.4 数组的逻辑运算 81
3.4.5 数组的集合运算 89
3.4.6 数组的数值排序 93
3.5 通用函数 100
3.5.1 初等函数 100
3.5.2 随机函数 105
3.5.3 统计函数 111
3.5.4 修约函数 121
3.6 线性代数运算 123
3.6.1 数组行列变换 123
3.6.2 数组的行列式 124
3.6.3 矩阵的乘积 128
3.6.4 矩阵的秩和逆矩阵 131
3.6.5 特征值和特征向量 133
3.6.6 解线性方程组 134
3.6.7 特征值分解 135
3.7 案例:电影推荐分析 138
3.7.1 问题理解 140
3.7.2 数据探索 140
3.7.3 代码实现 143
3.8 练习题 144
第4章 Python数据可视化:基于
Matplotlib 150
4.1 Matplotlib简介 150
4.1.1 Matplotlib的导入 150
4.1.2 画布与坐标轴设置 150
4.1.3 颜色与线型的设置 155
4.1.4 中文与负号显示设置 157
4.2 基本绘图函数 159
4.2.1 plot函数 159
4.2.2 grid函数 160
4.2.3 axhline函数 162
4.2.4 axvspan函数 164
4.2.5 annotate函数 165
4.2.6 text函数 167
4.2.7 title函数 168
4.2.8 legend函数 170
4.2.9 table函数 172
4.3 绘制二维图 174
4.3.1 绘制柱状图 174
4.3.2 绘制散点图 176
4.3.3 绘制直方图 178
4.3.4 绘制饼图 180
4.3.5 绘制棉棒图 181
4.3.6 绘制箱线图 183
4.3.7 绘制误差棒图 186
4.3.8 绘制极坐标图 188
4.3.9 绘制多子图 190
4.4 绘制三维图 195
4.4.1 绘制三维柱状图 196
4.4.2 绘制三维散点图 198
4.4.3 绘制三维折线图 200
4.4.4 绘制三维曲面图 202
4.4.5 绘制三维矢量图 204
4.5 数据可视化进阶 205
4.5.1 绘制动态图 205
4.5.2 响应鼠标事件 207
4.5.3 图像艺术处理 209
4.6 案例:在线商品浏览量与
销售量的可视化分析 216
4.6.1 问题理解 216
4.6.2 数据探索 216
4.6.3 代码实现 224
4.7 练习题 227
第5章 Python数据挖掘:基于
Pandas 230
5.1 Pandas简介 230
5.2 Series基本操作 231
5.2.1 Series的创建 231
5.2.2 Series的索引操作 232
5.2.3 Series的修改操作 232
5.2.4 Series的删除操作 233
5.3 DataFrame的基本操作 234
5.3.1 创建DataFrame 235
5.3.2 DataFrame数据的检索 236
5.3.3 修改DataFrame数据 237
5.3.4 删除DataFrame数据 238
5.3.5 DataFrame合并数据 238
5.3.6 排序与排名 242
5.3.7 重置行的索引或标签 244
5.3.8 多层级索引 245
5.3.9 算术运算与广播原理 246
5.4 数据的读写 247
5.4.1 CSV文件的读写 247
5.4.2 Excel文件的读写 249
5.4.3 其他文件的读写 251
5.4.4 其他操作技巧 253
5.5 数据预处理 255
5.5.1 重复值的处理 256
5.5.2 缺失值的处理 258
5.5.3 数据标准化 259
5.6 数据分析 260
5.6.1 描述性统计 260
5.6.2 分组分析 261
5.6.3 归类统计 262
5.6.4 交叉分析 263
5.6.5 相关分析 265
5.7 案例:电商平台订单数据
分析 266
5.8 练习题 276
第6章 Python符号计算:基于
SymPy 279
6.1 SymPy简介 279
6.2 定义符号 280
6.2.1 常规方式定义符号 280
6.2.2 序列方式定义符号 281
6.2.3 定义符号函数 281
6.3 表达式 282
6.3.1 表达式操作 282
6.3.2 替换与求值 284
6.4 微积分运算 284
6.4.1 极限运算 285
6.4.2 微分运算 285
6.4.3 积分运算 286
6.4.4 级数展开 287
6.5 SymPy绘图 288
6.5.1 二维绘图 288
6.5.2 参数方程绘图 290
6.5.3 隐式方程绘图 291
6.5.4 三维绘图 291
6.6 练习题 293
第7章 Python科学计算:基于
SciPy 296
7.1 概述 296
7.2 优化问题 297
7.2.1 优化问题的分类 297
7.2.2 单变量优化 298
7.2.3 无约束的多变量优化 301
7.2.4 非线性最小二乘问题 306
7.2.5 有约束的优化问题 307
7.3 插值处理 311
7.3.1 概述 311
7.3.2 应用场景 312
7.3.3 多项式函数和类 313
7.3.4 多项式插值 316
7.3.5 样条插值 319
7.3.6 多变量插值 321
7.4 练习题 326
参考文献 331
前言
第1章 数据分析概述 1
1.1 数据的含义及特征 1
1.1.1 数据的基本含义 1
1.1.2 数据的基本类型 1
1.1.3 数据的基本特征 2
1.2 数据分析思维 3
1.3 数据分析的层次 4
1.4 数据分析的流程与方法 5
1.5 练习题 6
第2章 数据分析的重要工具:
Python 7
2.1 Python数据分析概述 7
2.1.1 Python特点 7
2.1.2 Python与其他数据分析工具的
对比 7
2.1.3 Python数据分析常用库 8
2.2 Python数据分析环境配置 9
2.2.1 Anaconda的安装 9
2.2.2 Anaconda的使用 13
2.3 Python语言基础 15
2.3.1 Python语言中标识符与变量
赋值 15
2.3.2 Python 语言的语法规范 17
2.3.3 Python语言的数据结构 18
2.3.4 Python语言的分支结构 22
2.3.5 Python语言的循环结构 24
2.3.6 Python语言的函数 27
2.3.7 Python语言的类与实例 28
2.4 Jupyter Notebook应用基础 32
2.4.1 Jupyter Notebook的安装与
运行 32
2.4.2 Jupyter Notebook的主界面及
工作目录的设置 34
2.4.3 Jupyter Notebook主界面功能
介绍 35
2.4.4 Jupyter Notebook编辑界面功能
介绍 36
2.4.5 魔法命令的使用 37
2.5 练习题 38
第3章 Python数组及矩阵处理:
基于NumPy 40
3.1 NumPy简介 40
3.2 建立数组 41
3.2.1 什么是数组 41
3.2.2 数据的类型 42
3.2.3 数组的创建 43
3.2.4 数组的属性 48
3.2.5 数组的复制 50
3.2.6 数组的存取 51
3.3 数组操作 57
3.3.1 数组的变形 57
3.3.2 数组的拼接 59
3.3.3 数组的分割 62
3.3.4 数组的索引 64
3.3.5 数组的切片 66
3.3.6 替换数组值 68
3.3.7 删除行或列 71
3.3.8 插入行或列 72
3.4 数组运算 74
3.4.1 数组的广播原理 74
3.4.2 数组的四则运算 77
3.4.3 数组的复合运算 79
3.4.4 数组的逻辑运算 81
3.4.5 数组的集合运算 89
3.4.6 数组的数值排序 93
3.5 通用函数 100
3.5.1 初等函数 100
3.5.2 随机函数 105
3.5.3 统计函数 111
3.5.4 修约函数 121
3.6 线性代数运算 123
3.6.1 数组行列变换 123
3.6.2 数组的行列式 124
3.6.3 矩阵的乘积 128
3.6.4 矩阵的秩和逆矩阵 131
3.6.5 特征值和特征向量 133
3.6.6 解线性方程组 134
3.6.7 特征值分解 135
3.7 案例:电影推荐分析 138
3.7.1 问题理解 140
3.7.2 数据探索 140
3.7.3 代码实现 143
3.8 练习题 144
第4章 Python数据可视化:基于
Matplotlib 150
4.1 Matplotlib简介 150
4.1.1 Matplotlib的导入 150
4.1.2 画布与坐标轴设置 150
4.1.3 颜色与线型的设置 155
4.1.4 中文与负号显示设置 157
4.2 基本绘图函数 159
4.2.1 plot函数 159
4.2.2 grid函数 160
4.2.3 axhline函数 162
4.2.4 axvspan函数 164
4.2.5 annotate函数 165
4.2.6 text函数 167
4.2.7 title函数 168
4.2.8 legend函数 170
4.2.9 table函数 172
4.3 绘制二维图 174
4.3.1 绘制柱状图 174
4.3.2 绘制散点图 176
4.3.3 绘制直方图 178
4.3.4 绘制饼图 180
4.3.5 绘制棉棒图 181
4.3.6 绘制箱线图 183
4.3.7 绘制误差棒图 186
4.3.8 绘制极坐标图 188
4.3.9 绘制多子图 190
4.4 绘制三维图 195
4.4.1 绘制三维柱状图 196
4.4.2 绘制三维散点图 198
4.4.3 绘制三维折线图 200
4.4.4 绘制三维曲面图 202
4.4.5 绘制三维矢量图 204
4.5 数据可视化进阶 205
4.5.1 绘制动态图 205
4.5.2 响应鼠标事件 207
4.5.3 图像艺术处理 209
4.6 案例:在线商品浏览量与
销售量的可视化分析 216
4.6.1 问题理解 216
4.6.2 数据探索 216
4.6.3 代码实现 224
4.7 练习题 227
第5章 Python数据挖掘:基于
Pandas 230
5.1 Pandas简介 230
5.2 Series基本操作 231
5.2.1 Series的创建 231
5.2.2 Series的索引操作 232
5.2.3 Series的修改操作 232
5.2.4 Series的删除操作 233
5.3 DataFrame的基本操作 234
5.3.1 创建DataFrame 235
5.3.2 DataFrame数据的检索 236
5.3.3 修改DataFrame数据 237
5.3.4 删除DataFrame数据 238
5.3.5 DataFrame合并数据 238
5.3.6 排序与排名 242
5.3.7 重置行的索引或标签 244
5.3.8 多层级索引 245
5.3.9 算术运算与广播原理 246
5.4 数据的读写 247
5.4.1 CSV文件的读写 247
5.4.2 Excel文件的读写 249
5.4.3 其他文件的读写 251
5.4.4 其他操作技巧 253
5.5 数据预处理 255
5.5.1 重复值的处理 256
5.5.2 缺失值的处理 258
5.5.3 数据标准化 259
5.6 数据分析 260
5.6.1 描述性统计 260
5.6.2 分组分析 261
5.6.3 归类统计 262
5.6.4 交叉分析 263
5.6.5 相关分析 265
5.7 案例:电商平台订单数据
分析 266
5.8 练习题 276
第6章 Python符号计算:基于
SymPy 279
6.1 SymPy简介 279
6.2 定义符号 280
6.2.1 常规方式定义符号 280
6.2.2 序列方式定义符号 281
6.2.3 定义符号函数 281
6.3 表达式 282
6.3.1 表达式操作 282
6.3.2 替换与求值 284
6.4 微积分运算 284
6.4.1 极限运算 285
6.4.2 微分运算 285
6.4.3 积分运算 286
6.4.4 级数展开 287
6.5 SymPy绘图 288
6.5.1 二维绘图 288
6.5.2 参数方程绘图 290
6.5.3 隐式方程绘图 291
6.5.4 三维绘图 291
6.6 练习题 293
第7章 Python科学计算:基于
SciPy 296
7.1 概述 296
7.2 优化问题 297
7.2.1 优化问题的分类 297
7.2.2 单变量优化 298
7.2.3 无约束的多变量优化 301
7.2.4 非线性最小二乘问题 306
7.2.5 有约束的优化问题 307
7.3 插值处理 311
7.3.1 概述 311
7.3.2 应用场景 312
7.3.3 多项式函数和类 313
7.3.4 多项式插值 316
7.3.5 样条插值 319
7.3.6 多变量插值 321
7.4 练习题 326
参考文献 331















