Python数据挖掘与机器学习 / 普通高等教育人工智能专业系列教材
定价:¥79.00
作者: 刘锦,李洪东,李敏
出版时间:2025-11-03
出版社:机械工业出版社
- 机械工业出版社
- 9787111790662
- 1-1
- 562690
- 平装
- 2025-11-03
- 463
内容简介
本书从实践应用的角度出发,系统介绍了利用Python进行数据挖掘与机器学习所需的基础知识。内容涵盖数据挖掘的基本概念、机器学习的主要算法、Python编程语言基础、数据处理与可视化技术;深入解析了Python在数据挖掘与机器学习领域的核心库和框架,并通过具体实例展示了如何利用这些工具进行数据挖掘、模型训练与预测分析;同时,还介绍了机器学习模型的评估与优化方法,以及模型的实际应用场景。书中大部分章节配有习题与案例分析,旨在帮助读者深入理解并熟练掌握Python数据挖掘与机器学习的关键技能。
本书既可作为高等院校计算机、软件、大数据、人工智能等相关专业的教材,也可作为数据分析师、机器学习工程师等专业人士的技术参考书。
本书既可作为高等院校计算机、软件、大数据、人工智能等相关专业的教材,也可作为数据分析师、机器学习工程师等专业人士的技术参考书。
目录
前言
绪论
第一部分基础篇
第1章Python基础
11Python运行环境配置
111安装Python
112安装Anaconda
113PyTorch的安装
114编程IDE的安装
12Python基础语法
121标识符、关键字与变量操作
122数据结构与类型
123运算符
124控制结构
125函数
126文件操作
13Python常用库
131NumPy
132Pandas
133Matplotlib
134Scikit-Learn
14小结与习题
第2章数学基础
21线性代数
211向量与矩阵
212矩阵运算
22概率论
221概率分布
222条件概率分布
23微积分
231微分
232积分
24小结与习题
第二部分算法篇
第3章分类
31引例:图像分类
311CIFAR-10数据集
312ResNet分类
32支持向量机
321超平面
322最大间隔
323基本型的对偶问题
324核函数
33卷积神经网络
331LeNet
332AlexNet
333VGG
334ResNet
34Transformer
341Vision Transformer
342注意力机制
35小结与习题
第4章回归
41引例:房价预测
411加州房价数据集
412岭回归预测
42线性回归
421最小二乘法
422多元回归
43正则化回归
431岭回归
432LASSO回归
433弹性网回归
44时序回归
441自回归模型
442循环神经网络
443长短期记忆网络
444门控循环单元
45小结与习题
第5章聚类
51引例:鸢尾花的聚类分析
511鸢尾花数据集
512使用K均值聚类算法进行聚类
52K均值聚类
521K均值的基本步骤
522K均值的改进算法
53层次聚类
531层次聚类的基本步骤
532层次聚类的改进算法
54图聚类
541图聚类基础模型
542谱聚类与 Louvain算法
55小结与习题
第6章关联分析
61引例:购物篮关联分析
611线上商城交易数据
612频繁项集和关联规则
613Apriori算法挖掘频繁项集
614结果分析
62Apriori算法
621Apriori性质
622频繁项集的发现
623频繁项集到关联规则
63FP-Growth算法
631原理概述
632频繁模式树的构建
633频繁模式树的挖掘
634Apriori算法和 FP-Growth算法的优缺点
64频繁子图挖掘与类 Apriori算法
641频繁子图
642候选生成
643候选剪枝
644候选删除
65模式增长类算法——GSpan算法
651深度优先搜索和深度优先搜索树
652DFS编码和最小DFS编码
653最右路径扩展
654GSpan算法原理解析
66小结与习题
第7章异常检测
71引例:服务器异常用户操作检测
711Masquerade Data数据集
712特征提取
713模型训练
714模型表现评估与 K值选择
72近邻法
721K近邻算法
722KNN算法改进
73密度法
731局部异常因子算法
732密度法进阶
74自编码器
741编码器与解码器
742自编码器扩展
75小结与习题
第三部分实践篇
第8章案例-皮肤病诊断
81皮肤病数据集ISIC2018
811ISIC2018分类任务数据集
812ISIC2018分割任务数据集
82皮肤病变分类
821ResNet18模型分类
822皮肤病分类结果
83黑色素瘤病灶分割
831UNet模型
832Dice损失函数
833病灶分割结果
84小结
第9章案例-股价预测
91A股股票数据集
911上证指数基本盘数据
912Top5股票基本盘数据
92A股股票收益率预测
921LSTM模型预测
922股价预测结果
93A股股票模拟选股
931LSTM模型预测
932Top5股票预测结果
933Top5股票实际收益计算
94小结
第10章案例-单细胞转录组学
101单细胞数据集
1011单细胞聚类数据集
1012单细胞轨迹分析数据集
102单细胞聚类
1021数据导入和预处理
1022实现单细胞聚类
1023聚类结果分析
103单细胞轨迹分析
1031数据预处理
1032细胞群体划分与关系分析
1033细胞轨迹分析
104小结
第11章案例-商品共现分析与个性化推荐
111商品共现分析
1111任务介绍与数据集准备
1112FP-Growth算法实现商品共现分析
1113结果分析
112电商平台的个性化推荐
1121基于图神经网络进行个性化推荐
1122数据处理
1123用户-商品邻接矩阵的构建
1124NGCF模型实现
1125模型训练与测试
1126结果分析
113小结
第12章案例-农作物损害检测与成因分析
121基于卷积模型的番茄叶片病害识别
1211PlantVillage数据集
1212基于病害数据的卷积模型构建与训练
1213番茄叶片病害识别准确率与模型损失
122农作物异常成因分析
1221Machine Learning in Agriculture数据集
1222基于农作物环境数据的自编码器模型构建与训练
1223作物损害成因分析
123小结
附录符号表
参考文献
绪论
第一部分基础篇
第1章Python基础
11Python运行环境配置
111安装Python
112安装Anaconda
113PyTorch的安装
114编程IDE的安装
12Python基础语法
121标识符、关键字与变量操作
122数据结构与类型
123运算符
124控制结构
125函数
126文件操作
13Python常用库
131NumPy
132Pandas
133Matplotlib
134Scikit-Learn
14小结与习题
第2章数学基础
21线性代数
211向量与矩阵
212矩阵运算
22概率论
221概率分布
222条件概率分布
23微积分
231微分
232积分
24小结与习题
第二部分算法篇
第3章分类
31引例:图像分类
311CIFAR-10数据集
312ResNet分类
32支持向量机
321超平面
322最大间隔
323基本型的对偶问题
324核函数
33卷积神经网络
331LeNet
332AlexNet
333VGG
334ResNet
34Transformer
341Vision Transformer
342注意力机制
35小结与习题
第4章回归
41引例:房价预测
411加州房价数据集
412岭回归预测
42线性回归
421最小二乘法
422多元回归
43正则化回归
431岭回归
432LASSO回归
433弹性网回归
44时序回归
441自回归模型
442循环神经网络
443长短期记忆网络
444门控循环单元
45小结与习题
第5章聚类
51引例:鸢尾花的聚类分析
511鸢尾花数据集
512使用K均值聚类算法进行聚类
52K均值聚类
521K均值的基本步骤
522K均值的改进算法
53层次聚类
531层次聚类的基本步骤
532层次聚类的改进算法
54图聚类
541图聚类基础模型
542谱聚类与 Louvain算法
55小结与习题
第6章关联分析
61引例:购物篮关联分析
611线上商城交易数据
612频繁项集和关联规则
613Apriori算法挖掘频繁项集
614结果分析
62Apriori算法
621Apriori性质
622频繁项集的发现
623频繁项集到关联规则
63FP-Growth算法
631原理概述
632频繁模式树的构建
633频繁模式树的挖掘
634Apriori算法和 FP-Growth算法的优缺点
64频繁子图挖掘与类 Apriori算法
641频繁子图
642候选生成
643候选剪枝
644候选删除
65模式增长类算法——GSpan算法
651深度优先搜索和深度优先搜索树
652DFS编码和最小DFS编码
653最右路径扩展
654GSpan算法原理解析
66小结与习题
第7章异常检测
71引例:服务器异常用户操作检测
711Masquerade Data数据集
712特征提取
713模型训练
714模型表现评估与 K值选择
72近邻法
721K近邻算法
722KNN算法改进
73密度法
731局部异常因子算法
732密度法进阶
74自编码器
741编码器与解码器
742自编码器扩展
75小结与习题
第三部分实践篇
第8章案例-皮肤病诊断
81皮肤病数据集ISIC2018
811ISIC2018分类任务数据集
812ISIC2018分割任务数据集
82皮肤病变分类
821ResNet18模型分类
822皮肤病分类结果
83黑色素瘤病灶分割
831UNet模型
832Dice损失函数
833病灶分割结果
84小结
第9章案例-股价预测
91A股股票数据集
911上证指数基本盘数据
912Top5股票基本盘数据
92A股股票收益率预测
921LSTM模型预测
922股价预测结果
93A股股票模拟选股
931LSTM模型预测
932Top5股票预测结果
933Top5股票实际收益计算
94小结
第10章案例-单细胞转录组学
101单细胞数据集
1011单细胞聚类数据集
1012单细胞轨迹分析数据集
102单细胞聚类
1021数据导入和预处理
1022实现单细胞聚类
1023聚类结果分析
103单细胞轨迹分析
1031数据预处理
1032细胞群体划分与关系分析
1033细胞轨迹分析
104小结
第11章案例-商品共现分析与个性化推荐
111商品共现分析
1111任务介绍与数据集准备
1112FP-Growth算法实现商品共现分析
1113结果分析
112电商平台的个性化推荐
1121基于图神经网络进行个性化推荐
1122数据处理
1123用户-商品邻接矩阵的构建
1124NGCF模型实现
1125模型训练与测试
1126结果分析
113小结
第12章案例-农作物损害检测与成因分析
121基于卷积模型的番茄叶片病害识别
1211PlantVillage数据集
1212基于病害数据的卷积模型构建与训练
1213番茄叶片病害识别准确率与模型损失
122农作物异常成因分析
1221Machine Learning in Agriculture数据集
1222基于农作物环境数据的自编码器模型构建与训练
1223作物损害成因分析
123小结
附录符号表
参考文献















