- 电子工业出版社
- 9787121450778
- 1-3
- 512231
- 48253772-7
- 平塑
- 16开
- 2023-12
- 518
- 324
- 计算机科学与技术
- 本科
内容简介
本书内容分为数据挖掘理论和数据挖掘实践两部分。数据挖掘理论部分主要包括数据挖掘的基本概念、数据预处理、聚类分析、分类与回归、关联规则挖掘及离群点检测。数据挖掘实践部分讨论数据挖掘在文本挖掘和金融领域中的应用,通过虚假新闻检测和社交平台情绪分析等案例,展示数据挖掘在文本挖掘方面的应用;通过潜在贷款客户挖掘、贷款违约等案例展示数据挖掘在金融领域的应用。 本书可作为高等学校计算机、数据科学与大数据、电子商务、信息科学等相关专业的教材或参考书,也可供从事数据挖掘研究的科研、技术人员参考。
目录
目 录__eol__上篇 理论篇__eol__第1章 绪论 2__eol__1.1 数据挖掘技术使用背景 4__eol__1.2 数据挖掘任务及过程 5__eol__1.2.1 数据挖掘定义 5__eol__1.2.2 数据挖掘任务 5__eol__1.2.3 数据挖掘过程 7__eol__1.2.4 数据挖掘对象 8__eol__1.2.5 数据挖掘工具及其选择 13__eol__1.3 数据挖掘应用 13__eol__1.3.1 数据挖掘在计算机领域中的应用 14__eol__1.3.2 数据挖掘在商业领域中的应用 15__eol__1.3.3 数据挖掘在其他领域中的应用 16__eol__1.3.4 数据挖掘技术的前景 17__eol__1.4 数据挖掘与隐私保护 18__eol__本章小结 20__eol__习题1 20__eol__第2章 数据处理基础 23__eol__2.1 数据 24__eol__2.1.1 数据及数据类型 24__eol__2.1.2 数据集的类型 25__eol__2.2 数据探索 27__eol__2.2.1 描述性统计分析 27__eol__2.2.2 数据可视化 30__eol__2.2.3 辛普森悖论 34__eol__2.3 数据预处理 37__eol__2.3.1 数据清理 38__eol__2.3.2 数据集成 41__eol__2.3.3 特征变换 41__eol__2.3.4 数据归约 48__eol__2.4 相似性度量 55__eol__2.4.1 属性之间的相似性度量 56__eol__2.4.2 对象之间的相似性度量 57__eol__本章小结 60__eol__习题2 61__eol__第3章 分类和回归 65__eol__3.1 分类概述 66__eol__3.2 决策树分类方法 67__eol__3.2.1 决策树的基本概念 67__eol__3.2.2 构建决策树的要素 68__eol__3.2.3 Hunt算法 73__eol__3.2.4 C4.5算法 74__eol__3.2.5 CART算法 79__eol__3.2.6 决策树算法的特点 90__eol__3.3 贝叶斯分类方法 90__eol__3.3.1 贝叶斯定理 91__eol__3.3.2 朴素贝叶斯分类算法 92__eol__3.3.3 贝叶斯信念网络 96__eol__3.4 k-最近邻分类方法 97__eol__3.4.1 k-最近邻分类的基本问题 98__eol__3.4.2 k-最近邻分类算法描述 98__eol__3.4.3 k-最近邻分类算法的优缺点 100__eol__3.5 神经网络分类方法 100__eol__3.5.1 人工神经网络的基本概念 100__eol__3.5.2 典型神经网络模型介绍 102__eol__3.5.3 神经网络的特点 103__eol__3.5.4 深度网络和深度学习算法 104__eol__3.6 支持向量机 105__eol__3.7 集成分类方法 107__eol__3.8 分类问题拓展 113__eol__3.8.1 不平衡分类问题 113__eol__3.8.2 半监督学习 115__eol__3.8.3 单类分类 115__eol__3.8.4 多标签分类 115__eol__3.8.5 层次分类 115__eol__3.9 分类模型的评价 116__eol__3.9.1 分类模型性能评价指标 116__eol__3.9.2 分类模型的过度拟合 117__eol__3.9.3 评估分类模型性能的方法 117__eol__3.10 综合案例:信用风险分析 118__eol__3.11 回归分析 121__eol__3.11.1 多元线性回归模型 122__eol__3.11.2 非线性回归 125__eol__3.11.3 逻辑回归 127__eol__本章小结 131__eol__习题3 131__eol__第4章 聚类分析 137__eol__4.1 聚类分析概述 138__eol__4.2 k-means算法及其改进 141__eol__4.2.1 基本k-means算法 141__eol__4.2.2 k-means聚类算法的拓展 145__eol__4.3 层次聚类算法 150__eol__4.3.1 二分k-means算法 151__eol__4.3.2 BIRCH算法 152__eol__4.3.3 CURE算法 154__eol__4.3.4 ROCK算法 155__eol__4.4 基于密度的聚类算法 157__eol__4.5 基于图的聚类算法 160__eol__4.5.1 Chameleon聚类算法 160__eol__4.5.2 基于SNN的聚类算法 165__eol__4.6 一趟聚类算法 167__eol__4.6.1 阈值选择 167__eol__4.6.2 算法应用 171__eol__4.7 基于模型的聚类算法 172__eol__4.7.1 期望最大化方法 172__eol__4.7.2 概念聚类 172__eol__4.7.3 SOM方法 174__eol__4.8 聚类算法评价 176__eol__4.9 综合案例:航空公司客户价值分析 178__eol__本章小结 184__eol__习题4 184__eol__第5章 关联分析 187__eol__5.1 关联分析概述 188__eol__5.2 关联规则分析基础 188__eol__5.2.1 基本概念 188__eol__5.2.2 基础分析方法 190__eol__5.3 Apriori算法 192__eol__5.3.1 Apriori性质 192__eol__5.3.2 产生频繁项集 193__eol__5.3.3 频繁项集构造示例 194__eol__5.3.4 产生关联规则 195__eol__5.3.5 规则的评估标准 198__eol__5.3.6 Apriori算法评价 201__eol__5.4 FP-Growth算法 201__eol__5.4.1 FP-tree表示法 201__eol__5.4.2 构建FP-tree 202__eol__5.4.3 发现频繁项集 204__eol__5.5 关联规则扩展 205__eol__5.5.1 关联规则分类 205__eol__5.5.2 多层次关联规则 206__eol__5.5.3 多维度关联规则 207__eol__5.5.4 定量关联规则 208__eol__5.5.5 基于约束的关联规则 208__eol__5.5.6 序列模式挖掘 208__eol__5.6 综合案例:移动业务关联分析 209__eol__5.6.1 数据准备 209__eol__5.6.2 数据预处理 209__eol__5.6.3 关联规则挖掘过程 211__eol__5.6.4 规则的优化 214__eol__5.6.5 模型的应用 215__eol__本章小结 216__eol__习题5 216__eol__第6章 离群点挖掘 220__eol__6.1 离群点挖掘概述 221__eol__6.2 基于统计的方法 222__eol__6.3 基于距离的方法 224__eol__6.4 基于相对密度的方法 226__eol__6.5 基于聚类的方法 231__eol__6.5.1 基于对象的离群因子方法 231__eol__6.5.2 基于簇的离群因子方法 234__eol__6.5.3 基于聚类的动态数据离群点检测方法 236__eol__6.6 离群点挖掘方法的评估 237__eol__6.7 综合案例 237__eol__6.7.1 离群点检测在癌症诊断中的应用 237__eol__6.7.2 离群点检测在网络入侵检测中的应用 239__eol__本章小结 242__eol__习题6 242__eol__下篇 实践篇__eol__第7章 文本挖掘 246__eol__7.1 文本挖掘概述 247__eol__7.1.1 分词 247__eol__7.1.2 文本表示与词权重计算 250__eol__7.1.3 文本特征选择 252__eol__7.1.4 文本分类 253__eol__7.1.5 文本聚类 256__eol__7.1.6 文档自动摘要 258__eol__7.1.7 文本情感分析 262__eol__7.1.8 用户画像 265__eol__7.2 案例分析 269__eol__7.2.1 虚假新闻检测案例 269__eol__7.2.2 社交平台情感分类 277__eol__本章小结 283__eol__第8章 数据挖掘的金融应用 285__eol__8.1 数据挖掘在金融领域中的应用概述 287__eol__8.1.1 金融科技 287__eol__8.1.2 金融领域中的数据挖掘应用 289__eol__8.2 银行潜在贷款客户挖掘 295__eol__8.2.1 业务理解 295__eol__8.2.2 数据理解与数据准备 296__eol__8.2.3 模型构建与