数据挖掘 / 高级大数据人才培养丛书
¥58.00定价
作者: 王朝霞
出版时间:2021-05
出版社:电子工业出版社
- 电子工业出版社
- 9787121335310
- 1-11
- 206263
- 49225404-0
- 平塑勒
- 16开
- 2021-05
- 529
- 348
- 工学
- 软件工程
- TP274
- 计算机科学与技术
- 本科 研究生(硕士、EMBA、MBA、MPA、博士)
内容简介
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰高级 大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘 算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数 据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查 询分析)、工具与应用。 本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
目录
第1章绪论111数据挖掘基本概念1111数据挖掘的概念1112大数据环境下的数据挖掘2113数据挖掘的特性3114数据挖掘的过程312数据挖掘起源及发展历史413数据挖掘常用工具7131商用工具7132开源工具814数据挖掘应用场景10习题12参考文献13第2章数据预处理与相似性1421数据类型14211属性与度量14212数据集的类型1522数据预处理16221数据清理16222数据集成18223数据规范化19224数据约简20225数据离散化2223数据的相似性23231数值属性的相似性度量23232标称属性的相似性度量26233组合异种属性的相似性度量27234文档相似性度量28235离散序列相似性度量30习题31参考文献32第3章分类3331分类的基本概念、分类过程及分类器性能的评估33311分类的基本概念