- 北京航空航天大学出版社
- 9787512413764
- 1-1
- 132439
- 47155370-1
- 平装
- 小16开
- 2014-09
- 320
- 230
- 工学
- 软件工程
- TP311.13
- 信息管理、数理统计
- 本科
内容简介
王小妮著的《数据挖掘技术》是基于数据挖掘经典算法及数据挖掘领域最新研究技术进行数据分析的教材。全书内容包括数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析等。对当前数据挖掘的新技术——流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘进行了详细的介绍。该部分在讲述基本概念及典型算法的基础上配有新研究的算法模型及分析,并有实验数据分析及结果显示。最后对其他数据挖掘新技术,包括业务活动监控挖掘技术、云计算平台架构和数据挖掘方法及思维流程数据挖掘技术进行了描述。
本书可以作为高等院校信息管理、数理统计等专业有关数据挖掘教学的本科生或者研究生的专业课教材,也可以作为各类相关培训班的教材,还可以作为从事数据分析、智能产品软件开发人员的参考书及数据挖掘爱好者的自学用书。
本书可以作为高等院校信息管理、数理统计等专业有关数据挖掘教学的本科生或者研究生的专业课教材,也可以作为各类相关培训班的教材,还可以作为从事数据分析、智能产品软件开发人员的参考书及数据挖掘爱好者的自学用书。
目录
第1章 数据挖掘概述
1.1 数据挖掘的概念
1.1.1 KDD与数据挖掘
1.1.2 数据挖掘过程
1.1.3 数据挖掘任务
1.2 数据挖掘的发展历程
1.3 数据挖掘的分类
1.4 数据挖掘的研究方法
1.4.1 统计分析方法
1.4.2 决策树方法
1.4.3 模糊集方法
1.4.4 粗糙集方法
1.4.5 人工神经网络方法
1.4.6 遗传算法
1.5 国内外数据挖掘研究现状
本章小结
参考文献
第2章 分类算法分析
2.1 分类概念
2.2 分类方法
2.3 决策树算法
2.3.1 ID3算法
2.3.2 C4.5 算法
2.4 贝叶斯分类
2.5 粗糙集方法
2.5.1 粗糙集模型扩展
2.5.2 粗糙集与其他不确定信息处理理论的关系
2.6 遗传算法
2.7 其他分类算法
本章小结
参考文献
第3章 聚类算法分析
3.1 聚类分析概述
3.1.1 聚类分析概念
3.1.2 聚类分析中的数据类型
3.2 聚类分类
3.3 划分方法
3.3.1 K—means算法
3.3.2 Kmedoid算法
3.4 层次方法
3.4.1 BIRCH算法
3.4.2 CURE算法
3.5 密度方法
3.5.1 DBSCAN算法
3.5.2 OPTICS算法
3.6 网格方法
3.6.1 STING算法
3.6.2 Wavecluster算法
3.7 基于标量化Ⅲ的聚类统计算法
3.7.1 数学描述
3.7.2 计算方法
3.7.3 文本数据
3.7.4 应用实例
3.8 其他聚类算法
本章小结
参考文献
第4章 关联规则算法分析
4.1 关联规则概念
4.2 频繁模式挖掘
4.2.1 Apriori算法
4.2.2 FP-Growth算法
4.2.3 DHP算法
4.2.4 DIC算法
4.3 序列模式挖掘
4.3.1 序列模式挖掘的相关概念
4.3.2 基于Apriori的序列模式挖掘算法
4.3.3 基于序列模式增长的序列模式挖掘算法
4.4 其他关联规则算法
4.4.1 并行Apriori-like算法
4.4.2 并行FP-Growth算法
本章小结
参考文献
第5章 流数据挖掘技术
5.1 流数据挖掘技术概述
5.1.1 流数据概念
5.1.2 流数据模型
5.1.3 流数据挖掘算法特点
5.2 流数据挖掘技术分类
5.2.1 概要数据结构
5.2.2 滑动窗口技术
5.2.3 多窗口和衰减因子技术
5.2.4 近似技术、自适应技术和子空间技术
5.3 流数据聚类算法
5.3.1 CluStream算法
5.3.2 STREAM算法
5.3.3 D-Stream算法
5.3.4 GSCDS算法
5.3.5 HCluStrearn算法
5.4 流数据频繁项集挖掘算法
5.4.1 FPN算法
5.4.2 NEC算法
5.4.3 Kaal算法
5.5 流数据分类算法
5.5.1 VFDT算法
5.5.2 CVFDT算法
5.6 多数据流挖掘算法
5.7 实时数据流挖掘技术
5.7.1 实时数据挖掘概述
5.7.2 实时数据挖掘方法
5.7.3 实时数据挖掘框架
5.7.4 实时数据挖掘模型
5.7.5 实时数据挖掘技术分类
5.8 流数据聚类演化分析
5.9 流数据挖掘新技术研究
本章小结
参考文献
第6章 高维聚类算法
6.1 高维聚类算法概述
6.1.1 高维聚类算法
6.1.2 高维度数据处理方法
6.2 高维数据流聚类分类
6.3 维度对聚类算法精度的影响
6.3.1 维度对数据对象间距离的影响
6.3.2 维度对算法聚类精度的影响
6.3.3 传统方法降维实验
6.4 混合类型属性聚类算法
6.4.1 混合类型属性的处理
6.4.2 UCI数据集实验分析
6.4.3 流数据实验分析
6.5 基于复相关系数倒数的降维
6.5.1 复相关系数
6.5.2 复相关系数倒数加权
6.5.3 降维实验分析
本章小结
参考文献
第7章 分布式数据挖掘
7.1 分布式数据挖掘概述
7.2 分布式聚类算法
7.2.1 分布式聚类算法分析
7.2.2 分布式K-means聚类算法
7.2.3 分布式聚类算法K-DMeans
7.2.4 分布式聚类算法DK-Means
7.3 DRA-Kmeans聚类算法
7.3.1 DRA-Kmeans聚类算法相关技术
7.3.2 DRA-Kmeans局部聚类算法
7.3.3 DRA-Kmeans全局聚类算法
7.4 分布式数据挖掘新技术研究
本章小结
参考文献
第8章 物联网数据挖掘
8.1 物联网数据挖掘概述
8.2 物联网数据挖掘技术分类
8.2.1 物联网环境下基于分类的数据挖掘方法
8.2.2 物联网环境下基于关联规则的数据挖掘方法
8.2.3 物联网环境下基于聚类分析的数据挖掘方法
8.2.4 物联网环境下基于时间序列分析的数据挖掘方法
8.3 无线传感器网络中的聚类算法
8.4 RA-Cluster算法
8.5 物联网路由算法
8.5.1 无线分布式网络及其路由协议
8.5.2 物联网路由算法分析
8.5.3 RA-AODVjr算法原理
8.5.4 RA-AODVjr算法实验分析
8.6 物联网数据挖掘新技术研究
本章小结
参考文献
第9章 数据挖掘新技术
9.1 业务活动监控挖掘技术
9.1.1 业务活动监控概述
9.1.2 业务活动监控系统预测模型
9.1.3 结构数据挖掘理论
9.2 云计算平台架构及数据挖掘方法
9.2.1 基于云计算的分布式数据挖掘平台架构
9.2.2 基于云计算的分布式数据挖掘算法
9.3 思维流程数据挖掘技术
9.3.1 思维流程发现的基本思想
9.3.2 思维流程发现的关键任务
9.3.3 思维流程发现研究的关键问题
本章小结
参考文献
1.1 数据挖掘的概念
1.1.1 KDD与数据挖掘
1.1.2 数据挖掘过程
1.1.3 数据挖掘任务
1.2 数据挖掘的发展历程
1.3 数据挖掘的分类
1.4 数据挖掘的研究方法
1.4.1 统计分析方法
1.4.2 决策树方法
1.4.3 模糊集方法
1.4.4 粗糙集方法
1.4.5 人工神经网络方法
1.4.6 遗传算法
1.5 国内外数据挖掘研究现状
本章小结
参考文献
第2章 分类算法分析
2.1 分类概念
2.2 分类方法
2.3 决策树算法
2.3.1 ID3算法
2.3.2 C4.5 算法
2.4 贝叶斯分类
2.5 粗糙集方法
2.5.1 粗糙集模型扩展
2.5.2 粗糙集与其他不确定信息处理理论的关系
2.6 遗传算法
2.7 其他分类算法
本章小结
参考文献
第3章 聚类算法分析
3.1 聚类分析概述
3.1.1 聚类分析概念
3.1.2 聚类分析中的数据类型
3.2 聚类分类
3.3 划分方法
3.3.1 K—means算法
3.3.2 Kmedoid算法
3.4 层次方法
3.4.1 BIRCH算法
3.4.2 CURE算法
3.5 密度方法
3.5.1 DBSCAN算法
3.5.2 OPTICS算法
3.6 网格方法
3.6.1 STING算法
3.6.2 Wavecluster算法
3.7 基于标量化Ⅲ的聚类统计算法
3.7.1 数学描述
3.7.2 计算方法
3.7.3 文本数据
3.7.4 应用实例
3.8 其他聚类算法
本章小结
参考文献
第4章 关联规则算法分析
4.1 关联规则概念
4.2 频繁模式挖掘
4.2.1 Apriori算法
4.2.2 FP-Growth算法
4.2.3 DHP算法
4.2.4 DIC算法
4.3 序列模式挖掘
4.3.1 序列模式挖掘的相关概念
4.3.2 基于Apriori的序列模式挖掘算法
4.3.3 基于序列模式增长的序列模式挖掘算法
4.4 其他关联规则算法
4.4.1 并行Apriori-like算法
4.4.2 并行FP-Growth算法
本章小结
参考文献
第5章 流数据挖掘技术
5.1 流数据挖掘技术概述
5.1.1 流数据概念
5.1.2 流数据模型
5.1.3 流数据挖掘算法特点
5.2 流数据挖掘技术分类
5.2.1 概要数据结构
5.2.2 滑动窗口技术
5.2.3 多窗口和衰减因子技术
5.2.4 近似技术、自适应技术和子空间技术
5.3 流数据聚类算法
5.3.1 CluStream算法
5.3.2 STREAM算法
5.3.3 D-Stream算法
5.3.4 GSCDS算法
5.3.5 HCluStrearn算法
5.4 流数据频繁项集挖掘算法
5.4.1 FPN算法
5.4.2 NEC算法
5.4.3 Kaal算法
5.5 流数据分类算法
5.5.1 VFDT算法
5.5.2 CVFDT算法
5.6 多数据流挖掘算法
5.7 实时数据流挖掘技术
5.7.1 实时数据挖掘概述
5.7.2 实时数据挖掘方法
5.7.3 实时数据挖掘框架
5.7.4 实时数据挖掘模型
5.7.5 实时数据挖掘技术分类
5.8 流数据聚类演化分析
5.9 流数据挖掘新技术研究
本章小结
参考文献
第6章 高维聚类算法
6.1 高维聚类算法概述
6.1.1 高维聚类算法
6.1.2 高维度数据处理方法
6.2 高维数据流聚类分类
6.3 维度对聚类算法精度的影响
6.3.1 维度对数据对象间距离的影响
6.3.2 维度对算法聚类精度的影响
6.3.3 传统方法降维实验
6.4 混合类型属性聚类算法
6.4.1 混合类型属性的处理
6.4.2 UCI数据集实验分析
6.4.3 流数据实验分析
6.5 基于复相关系数倒数的降维
6.5.1 复相关系数
6.5.2 复相关系数倒数加权
6.5.3 降维实验分析
本章小结
参考文献
第7章 分布式数据挖掘
7.1 分布式数据挖掘概述
7.2 分布式聚类算法
7.2.1 分布式聚类算法分析
7.2.2 分布式K-means聚类算法
7.2.3 分布式聚类算法K-DMeans
7.2.4 分布式聚类算法DK-Means
7.3 DRA-Kmeans聚类算法
7.3.1 DRA-Kmeans聚类算法相关技术
7.3.2 DRA-Kmeans局部聚类算法
7.3.3 DRA-Kmeans全局聚类算法
7.4 分布式数据挖掘新技术研究
本章小结
参考文献
第8章 物联网数据挖掘
8.1 物联网数据挖掘概述
8.2 物联网数据挖掘技术分类
8.2.1 物联网环境下基于分类的数据挖掘方法
8.2.2 物联网环境下基于关联规则的数据挖掘方法
8.2.3 物联网环境下基于聚类分析的数据挖掘方法
8.2.4 物联网环境下基于时间序列分析的数据挖掘方法
8.3 无线传感器网络中的聚类算法
8.4 RA-Cluster算法
8.5 物联网路由算法
8.5.1 无线分布式网络及其路由协议
8.5.2 物联网路由算法分析
8.5.3 RA-AODVjr算法原理
8.5.4 RA-AODVjr算法实验分析
8.6 物联网数据挖掘新技术研究
本章小结
参考文献
第9章 数据挖掘新技术
9.1 业务活动监控挖掘技术
9.1.1 业务活动监控概述
9.1.2 业务活动监控系统预测模型
9.1.3 结构数据挖掘理论
9.2 云计算平台架构及数据挖掘方法
9.2.1 基于云计算的分布式数据挖掘平台架构
9.2.2 基于云计算的分布式数据挖掘算法
9.3 思维流程数据挖掘技术
9.3.1 思维流程发现的基本思想
9.3.2 思维流程发现的关键任务
9.3.3 思维流程发现研究的关键问题
本章小结
参考文献