数据挖掘导论 / 高等院校计算机教育系列教材
¥28.00定价
作者: 戴红,常子冠等
出版时间:2014-11
出版社:清华大学出版社
- 清华大学出版社
- 9787302381044
- 1-1
- 139863
- 16开
- 2014-11
- 工学
- 软件工程
- TP274
- 计算机类
- 高职
内容简介
本书为数据挖掘入门级教材,共分8章,主要内容分为三个专题:技术、数据和评估。技术专题包括决策树技术、K-means算法、关联分析技术、神经网络技术、回归分析技术、贝叶斯分析、凝聚聚类、概念分层聚类、混合模型聚类技术的EM算法、时间序列分析和基于Web的数据挖掘等常用的机器学习方法和统计技术。数据专题包括数据库中的知识发现处理模型和数据仓库及OLAP技术。评估专题包括利用检验集分类正确率和混淆矩阵,并结合检验集置信区间评估有指导学习模型,使用无指导聚类技术评估有指导模型,利用Lift和假设检验比较两个有指导学习模型,使用MS Excel 2010和经典的假设检验模型评估属性,使用簇质量度量方法和有指导学习技术评估无指导聚类模型。 本书秉承教材风格,强调广度讲解。注重成熟模型和开源工具的使用,以提高学习者的应用能力为目标;注重结合实例和实验,加强基本概念和原理的理解和运用;注重实例的趣味性和生活性,提高学习者学习的积极性。使用章后练习、计算和实验作业巩固和检验所学内容;使用词汇表附录,解释和规范数据挖掘学科专业术语;使用适合教学的简单易用开源的Weka和通用的MS Excel软件工具实施数据挖掘验证和体验数据挖掘
目录
第1章认识数据挖掘.
1.1数据挖掘的定义
1.2机器学习
1.2.1 概念学习
1.2.2归纳学习
1.2.3有指导的学习
1.2.4无指导的聚类
1.3 数据查询
1.4专家系统.
1.5数据挖掘的过程
1.5.1准备数据
1.5.2挖掘数据
1.5.3解释和评估数据
1.5.4模型应用
1.6数据挖掘的作用
1.6.1分类
1.6.2估计
1.6.3预测
1.6.4无指导聚类
1.6.5关联关系分析
1.7数据挖掘技术
1.7.1神经网络
1.7.2回归分析
1.7.3关联分析
1.7.4聚类技术
1.8数据挖掘的应用
1.8.1应用领域
1.8.2成功案例
1.9 Weka数据挖掘软件
1.9.1 Weka简介
1.9.2使用Weka建立决策树
模型
1.9.3使用Weka进行聚类
1.9.4使用Weka进行关联分
本章小结
习题
第2章基本数据挖掘技术
2.1 决策树
2.1.1决策树算法的一般过程
2.1.2决策树算法的关键技术
2.1.3决策树规则
2.1.4其他决策树算法
2.1.5决策树小结
2.2关联规则
2.2.1关联规则概述
2.2.2关联分析
2.2.3关联规Nd,结
2.3聚类分析技术
2.3.1 K.means算法
2.3.2 K.means算法小结
2.4数据挖掘技术的选择
本章小结
习题
第3章数据库中的知识发现
3.1 知识发现的基本过程
3.1.1 KDD过程模型
3.1.2知识发现软件
3.1_3 KDD过程的参与者
3.2 KDD过程模型的应用
3.2.1步骤l:商业理解l
3.2.2步骤2:数据理解l
3.2.3步骤3:数据准备
3.2.4步骤4:建模
3.2.5评估
3.2.6部署和采取行动
3.3实验:KDD案例
本章小结
习题
第4章数据仓库
4.1数据库与数据仓库一
4.1.1数据(库)模型
4.1.2规范化与反向规范化一
4.2设计数据仓库
4.2.1 数据抽取、清洗、变换和
加载·
4.2.2数据仓库模型
4.2.3数据集市
4.2.4决策支持系统一
4.3联机分析处理
4.3,1概述
4.3.2实验:使用OLAP辅助
驾驶员行为分析
4.4使用Excel数据透视表和数据
透视图分析数据
4.4.1 创建简单数据透视表和
透视图
4|412创建多维透视表和透视图
本章小结
习题
第5章评估技术
5.1数据挖掘评估概述……
第6章神经网络技术
第7章统计技术
第8章时间序列和基于Web的数据挖掘
附录A词汇表
附录B数据挖掘数据集
参考文献
1.1数据挖掘的定义
1.2机器学习
1.2.1 概念学习
1.2.2归纳学习
1.2.3有指导的学习
1.2.4无指导的聚类
1.3 数据查询
1.4专家系统.
1.5数据挖掘的过程
1.5.1准备数据
1.5.2挖掘数据
1.5.3解释和评估数据
1.5.4模型应用
1.6数据挖掘的作用
1.6.1分类
1.6.2估计
1.6.3预测
1.6.4无指导聚类
1.6.5关联关系分析
1.7数据挖掘技术
1.7.1神经网络
1.7.2回归分析
1.7.3关联分析
1.7.4聚类技术
1.8数据挖掘的应用
1.8.1应用领域
1.8.2成功案例
1.9 Weka数据挖掘软件
1.9.1 Weka简介
1.9.2使用Weka建立决策树
模型
1.9.3使用Weka进行聚类
1.9.4使用Weka进行关联分
本章小结
习题
第2章基本数据挖掘技术
2.1 决策树
2.1.1决策树算法的一般过程
2.1.2决策树算法的关键技术
2.1.3决策树规则
2.1.4其他决策树算法
2.1.5决策树小结
2.2关联规则
2.2.1关联规则概述
2.2.2关联分析
2.2.3关联规Nd,结
2.3聚类分析技术
2.3.1 K.means算法
2.3.2 K.means算法小结
2.4数据挖掘技术的选择
本章小结
习题
第3章数据库中的知识发现
3.1 知识发现的基本过程
3.1.1 KDD过程模型
3.1.2知识发现软件
3.1_3 KDD过程的参与者
3.2 KDD过程模型的应用
3.2.1步骤l:商业理解l
3.2.2步骤2:数据理解l
3.2.3步骤3:数据准备
3.2.4步骤4:建模
3.2.5评估
3.2.6部署和采取行动
3.3实验:KDD案例
本章小结
习题
第4章数据仓库
4.1数据库与数据仓库一
4.1.1数据(库)模型
4.1.2规范化与反向规范化一
4.2设计数据仓库
4.2.1 数据抽取、清洗、变换和
加载·
4.2.2数据仓库模型
4.2.3数据集市
4.2.4决策支持系统一
4.3联机分析处理
4.3,1概述
4.3.2实验:使用OLAP辅助
驾驶员行为分析
4.4使用Excel数据透视表和数据
透视图分析数据
4.4.1 创建简单数据透视表和
透视图
4|412创建多维透视表和透视图
本章小结
习题
第5章评估技术
5.1数据挖掘评估概述……
第6章神经网络技术
第7章统计技术
第8章时间序列和基于Web的数据挖掘
附录A词汇表
附录B数据挖掘数据集
参考文献