基于Clementine的数据挖掘 / 统计数据分析与应用丛书
¥56.00定价
作者: 薛薇,陈欢歌
出版时间:2012-03
出版社:中国人民大学出版社
- 中国人民大学出版社
- 9787300151625
- 170035
- 41158339-6
- 16开
- 2012-03
- 695
- 工学
- 软件工程
- TP274
- 统计学
- 本科
内容简介
数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。Clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。
作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:
以数据挖掘过程为线索介绍Clementine软件。薛薇和陈欢歌编著的《基于Clementine的数据挖掘》以数据挖掘的实践过程为主线,从Clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握Clementine的基本功能和一般方法,并可迅速运用到实际工作中。
数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。
数据挖掘方法讲解全面,语言通俗。《基于Clementine的数据挖掘》对Clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。
作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:
以数据挖掘过程为线索介绍Clementine软件。薛薇和陈欢歌编著的《基于Clementine的数据挖掘》以数据挖掘的实践过程为主线,从Clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握Clementine的基本功能和一般方法,并可迅速运用到实际工作中。
数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。
数据挖掘方法讲解全面,语言通俗。《基于Clementine的数据挖掘》对Clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。
目录
第1章 数据挖掘和Clementine使用概述
1.1 数据挖掘的产生背景
1.2 什么是数据挖掘
1.3 Clementine软件概述
第2章 Clementine的数据读入和数据集成
2.1 变量类型
2.2 读人数据
2.3 生成实验方案
2.4 数据集成
第3章 Clementine的数据理解
3.1 变量说明
3.2 数据质量的评估和调整
3.3 数据的排序
3.4 数据的分类汇总
3.5 用户报表
第4章 Clementine的数据准备
4.1 变量变换
4.2 变量派生
4.3 数据精简
4.4 数据筛选
4.5 数据准备的其他工作
第5章 Clementine的基本分析
5.1 数值型变量的基本分析
5.2 两分类型变量相关性的研究
5.3 两总体的均值比较
5.4 rfm分析
第6章 Clementine的数据精简
6.1 变量值的离散化处理
6.2 特征选择
6.3 因子分析
第7章 分类预测:Clementine的决策树
7.1 决策树算法概述
7.2 Clementine的c5.0算法及应用
7.3 Clementine的分类回归树及应用
7.4 Clementine的chaid算法及应用
7.5 Clementine的quest算法及应用
7.6 模型的对比分析
第8章 分类预测:Clementine的人工神经网络
8.1 人工神经网络算法概述
8.2 Clementine的b-p反向传播网络
8.3 Clementine的b-p反向传播网络的应用
8.4 Clementine的径向基函数网络及应用
第9章 分类预测:Clementine的支持向量机
9.1 支持向量分类的基本思路
9.2 支持向量分类的基本原理
9.3 支持向量回归
9.4 支持向量机的应用
第10章 分类预测:Clementine的logistic回归分析
10.1 logistic回归分析概述
10.2 二项logistic回归分析
10.3 二项logistic回归分析的应用
10.4 多项logistic回归分析及应用
第11章 分类预测:Clementine的判别分析
11.1 距离判别法
11.2 fisher判别法
11.3 贝叶斯判别法
11.4 判别分析的应用
第12章 分类预测:Clementine的贝叶斯网络
12.1 贝叶斯方法基础
12.2 贝叶斯网络概述
12.3 tan贝叶斯网络
12.4 马尔科夫毯网络
12.5 贝叶斯网络的应用
第13章 探索内部结构:Clementine的聚类分析
13.1 聚类分析的一般问题
13.2 Clementine的k-means聚类及应用
13.3 Clementine的两步聚类及应用
13.4 Clementine的kohonen网络聚类及应用
13.5 基于聚类分析的离群点探索
第14章 探索内部结构:Clementine的关联分析
14.1 简单关联规则及其有效性
14.2 Clementine的apriori算法及应用
14.3 Clementine的gri算法及应用
14.4 Clementine的序列关联及应用
参考文献
1.1 数据挖掘的产生背景
1.2 什么是数据挖掘
1.3 Clementine软件概述
第2章 Clementine的数据读入和数据集成
2.1 变量类型
2.2 读人数据
2.3 生成实验方案
2.4 数据集成
第3章 Clementine的数据理解
3.1 变量说明
3.2 数据质量的评估和调整
3.3 数据的排序
3.4 数据的分类汇总
3.5 用户报表
第4章 Clementine的数据准备
4.1 变量变换
4.2 变量派生
4.3 数据精简
4.4 数据筛选
4.5 数据准备的其他工作
第5章 Clementine的基本分析
5.1 数值型变量的基本分析
5.2 两分类型变量相关性的研究
5.3 两总体的均值比较
5.4 rfm分析
第6章 Clementine的数据精简
6.1 变量值的离散化处理
6.2 特征选择
6.3 因子分析
第7章 分类预测:Clementine的决策树
7.1 决策树算法概述
7.2 Clementine的c5.0算法及应用
7.3 Clementine的分类回归树及应用
7.4 Clementine的chaid算法及应用
7.5 Clementine的quest算法及应用
7.6 模型的对比分析
第8章 分类预测:Clementine的人工神经网络
8.1 人工神经网络算法概述
8.2 Clementine的b-p反向传播网络
8.3 Clementine的b-p反向传播网络的应用
8.4 Clementine的径向基函数网络及应用
第9章 分类预测:Clementine的支持向量机
9.1 支持向量分类的基本思路
9.2 支持向量分类的基本原理
9.3 支持向量回归
9.4 支持向量机的应用
第10章 分类预测:Clementine的logistic回归分析
10.1 logistic回归分析概述
10.2 二项logistic回归分析
10.3 二项logistic回归分析的应用
10.4 多项logistic回归分析及应用
第11章 分类预测:Clementine的判别分析
11.1 距离判别法
11.2 fisher判别法
11.3 贝叶斯判别法
11.4 判别分析的应用
第12章 分类预测:Clementine的贝叶斯网络
12.1 贝叶斯方法基础
12.2 贝叶斯网络概述
12.3 tan贝叶斯网络
12.4 马尔科夫毯网络
12.5 贝叶斯网络的应用
第13章 探索内部结构:Clementine的聚类分析
13.1 聚类分析的一般问题
13.2 Clementine的k-means聚类及应用
13.3 Clementine的两步聚类及应用
13.4 Clementine的kohonen网络聚类及应用
13.5 基于聚类分析的离群点探索
第14章 探索内部结构:Clementine的关联分析
14.1 简单关联规则及其有效性
14.2 Clementine的apriori算法及应用
14.3 Clementine的gri算法及应用
14.4 Clementine的序列关联及应用
参考文献