数据仓库与数据挖掘导论
作者: 李於洪主编
出版时间:2012-08
出版社:经济科学出版社
- 经济科学出版社
- 9787514122374
- 103580
- 43154771-0
- 16开
- 2012-08
- 工学
- 软件工程
- TP311.13
- 财经类
- 本科
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。
《数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。
第1章 数据仓库概念与内涵
1.1 数据仓库概念
1.1.1 数据仓库的产生
1.1.2 数据仓库应用实例:理解数据仓库的应用目标与作用
1.2 数据仓库的四个基本特征
1.2.1 数据仓库的数据是面向主题的
1.2.2 数据仓库的数据是集成的
1.2.3 数据仓库的数据是不可更新的
1.2.4 数据仓库的数据是随时间不断变化的
1.3 数据集市——部门级数据仓库
1.3.1 自上而下构建数据集市
1.3.2 自下而上构建数据集市
1.3.3 自上而下与自下而上结合构建数据集市
习题
讨论题
第2章 数据挖掘概念与内涵
2.1 数据挖掘概念
2.1.1 数据挖掘的产生
2.1.2 数据挖掘应用实例:理解数据挖掘的应用目标与作用
2.1.3 数据挖掘的定义
2.2 数据仓库与数据挖掘的关系
讨论题
第二篇 数据仓库
第3章 数据仓库的体系结构及其组成部分
3.1 数据仓库的体系结构
3.2 数据仓库的组成部分及其功能
3.2.1 源数据部分
3.2.2 数据准备部分
3.2.3 数据存储部分
3.2.4 信息传递部分
思考题
习题
讨论题
第4章 数据仓库数据的商业需求分析
4.1 收集商业需求数据碰到的问题
4.2 商业数据维度化分析
4.3 商业维度实例分析
思考题
习题
第5章 数据仓库的维度建模
5.1 维度建模基础
5.2 星型模式及其查询的钻取
5.2.1 星型模式维度表内容的特征
5.2.2 星型模式事实表内容的特征
5.2.3 星型模式的优势
5.3 雪花型模式:对维度表的再处理
5.4 聚集事实表:对关键指标的再处理
5.4.1 理解事实表的数据量
5.4.2 理解聚集事实表的作用
5.4.3 对事实表进行聚集的三种方法
5.4.4 聚集过程中相关问题讨论
思考题
习题
第6章 数据仓库中的联机分析处理——OLAP
6.1 OLAP的含义、规则与特征
6.1.1 OLAP的含义
6.1.2 OLAP的规则
6.1.3 OLAP的特征
6.2 OLAP的基本操作
6.2.1 切片
6.2.2 切块
6.2.3 上钻与下钻
6.2.4 旋转
6.3 OLAP模型结构
6.3.1 关系联机分析处理(ROLAP)结构
6.3.2 多维联机分析处理(MOLAP)结构
6.3.3 混合联机分析处理(HOLAP)结构
6.3.4 桌面联机分析处理(DOLAP)结构
6.3.5 客户联机分析处理(COLAP)结构
6.4 典型OLAP模型的数据组织与应用
6.4.1 ROLAP的数据组织与应用
6.4.2 MOIAP的数据组织与应用
6.4.3 ROLAP与MOLAP的数据组织与应用比较
思考题
习题
讨论题
第7章 元数据
7.1 数据仓库中元数据的重要性
7.1.1 数据仓库的用户需要元数据
7.1.2 数据仓库的开发者需要元数据
7.1.3 数据仓库的管理员需要元数据
7.2 关于数据仓库元数据的概念界定
7.3 元数据的几种分类方法
7.3.1 按用途对元数据进行分类
7.3.2 按数据仓库功能区域划分的元数据分类
7.3.3 按元数据的活动方式进行分类
7.4 元数据的作用
7.5 元数据管理的体系结构
7.5.1 集中的方法
7.5.2 分散的方法
7.5.3 分布的方法
思考题
习题
讨论题
第三篇 数据挖掘
第8章 关联分析
8.1 关联规则概念
8.1.1 关联规则的支持度和置信度
8.1.2 关联规则分类
8.2 关联规则挖掘算法
8.2.1 Apriori算法
8.2.2 强关联规则的有效性和可行性问题
习题
讨论题
第9章 神经网络算法
9.1 神经网络概念
9.1.1 神经网络原理
9.1.2 人工神经网络
9.2 人工神经网络模型
9.2.1 感知器
9.2.2 带隐层的人工神经网络
9.3 前馈神经网络
9.3.1 训练神经网络
9.3.2 后向传播如何工作
9.3.3 后向传播算法
9.4 有关神经网络研究中应该关注的几个问题
9.4.1 关于对神经网络的理解问题
9.4.2 关于神经网络应用中数据准备的问题
9.4.3 影响神经网络模型性能的部分因素
9.4.4 学习神经网络,需要强调以下几个问题
习题
讨论题
第10章 决策树算法
10.1 决策树分类概述
10.1.1 决策树分类步骤
10.1.2 决策树分类举例
10.2 ID3算法
10.2.1 信息论基本原理
10.2.2 ID3算法的基本思想与实例
10.2.3 ID3算法应用中应该关注的几个问题
习题
讨论题
第11章 聚类分析
11.1 聚类分析概述
11.1.1 聚类分析中的数据类型
11.1.2 聚类分析中相异度(相似性、差异度)测度方法
11.2 聚类分析方法
11.2.1 划分聚类方法
11.2.2 基于密度的聚类方法
11.2.3 聚类分析在数据挖掘应用中有待进一步研究的问题
习题
讨论题
第四篇 实验与工具
第12章 数据仓库实验与工具应用
第13章 神经网络建模实验与工具应用
第14章 决策树与关联分析实验与工具应用
参考文献