注册 登录 进入教材巡展
#

出版时间:2023-04

出版社:西安电子科技大学出版社

以下为《数据分析与挖掘实践(Python版)》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 西安电子科技大学出版社
  • 9787560667973
  • 1-1
  • 461564
  • 16开
  • 2023-04
  • 自动化技术、计算机技术
  • 本科
内容简介
本书主要介绍Python数据分析与挖掘实践,全书共11章,分为基础篇和综合篇。第1~5章为基础篇,包括Python数据分析与挖掘概述、Python数据分析与挖掘基础、数据探索、数据预处理、挖掘建模等内容;第6~11章为综合篇,列举分析了6个实用案例,包括基于关联规则进行商品推荐案例、电信用户流失分类预测案例、二手车交易价格回归预测案例、航空公司客户价值聚类分析案例、基于LGB进行新闻文本分类案例、基于PyTorch进行昆虫图像分类案例。通过基础篇和综合篇的学习,可以掌握数据分析与挖掘的实践技能,能够综合利用数据分析与挖掘技术解决实际问题。
本书可作为大数据工程专业数据分析与挖掘课程的实验指导书,也可作为数据分析与挖掘及软件开发人员的参考书。
目录
基 础 篇

第1章 Python数据分析与挖掘概述 2
1.1 Python语言概述 2
1.2 常用的扩展库 3
1.3 Anaconda的安装与使用 5
1.4 PyCharm的安装与使用 19
第2章 Python数据分析与挖掘基础 29
2.1 NumPy的基本操作 29
2.2 Pandas的基本操作 43
2.3 Matplotlib的基本操作 56
2.4 Scikit-Learn的基本操作 74
2.5 利用Pandas进行数据分析 77
第3章 数据探索 86
3.1 异常值分析 86
3.2 缺失值分析 86
3.3 统计量分析 87
3.4 相关性分析 88
3.5 对比分析 90
3.6 准备数据 91
3.7 探索性分析 92
3.8 相关性分析 93
3.9 数据特征分布 95
3.10 数据分布可视化 96
3.11 分类模型 106
第4章 数据预处理 111
4.1 数据清洗 111
4.2 数据集成 113
4.3 数据归约 115
4.4 数据转换 117
4.5 数据清理:缺失值的检测与填补 119
4.6 数据集成:冗余和相关性分析 124
4.7 数据归约 130
4.8 数据变换 139
第5章 挖掘建模 150
5.1 关联规则挖掘 150
5.2 分类和预测 151
5.3 聚类分析 156
5.4 关联规则挖掘实验 160
5.5 决策树分类实验 171
5.6 模型评估实验 178
5.7 管道和超参数调优实验 187
5.8 支持向量机实验 197
5.9 神经网络实验 203
5.10 基于划分方法聚类实验 206
5.11 基于层次方法聚类实验 210
5.12 基于密度方法聚类实验 213
5.13 聚类评估实验 217

综 合 篇

第6章 基于关联规则进行商品推荐案例 226
6.1 案例概述 226
6.2 电影数据准备 227
6.3 利用关联规则实现电影推荐实战 228
6.4 优化思路 240
第7章 电信用户流失分类预测案例 241
7.1 案例概述 241
7.2 数据介绍 242
7.3 数据预处理 244
7.4 可视化分析 247
7.5 特征工程 259
7.6 模型预测 262
7.7 模型评估 265
7.8 分析与决策 267
7.9 优化思路 269
第8章 二手车交易价格回归预测案例 270
8.1 案例概述 270
8.2 导入函数工具箱 272
8.3 数据读取 272
8.4 特征与标签构建 278
8.5 模型训练与预测 280
第9章 航空公司客户价值聚类分析案例 284
9.1 案例概述 284
9.2 数据预处理 286
9.3 特征工程 291
9.4 模型训练与对数据的预测 293
9.5 尝试使用RFM模型 294
9.6 分析与决策 294
9.7 LCRFM模型作图 296
9.8 RFM模型作图 297
9.9 DBSCAN模型对LCRFM特征进行计算 298
9.10 根据LCRFM结果进行分析 299
9.11 优化思路 301
第10章 基于LGB进行新闻文本分类案例 302
10.1 案例概述 302
10.2 数据分析 303
10.3 数据读取与预处理 305
10.4 文本特征提取 311
10.5 最优化参数搜索 312
10.6 优化思路 313
第11章 基于PyTorch进行昆虫图像分类案例 315
11.1 案例概述 315
11.2 从零实现一个用于图像分类的卷积神经网络 316
11.3 数据处理 318
11.4 训练模型 321
11.5 可视化模型预测结果 323
11.6 使用模型 325
11.7 优化思路 327
参考文献 328