大数据智能分析理论与方法
作者: 张紫琼,叶强
出版时间:2023-07-24
出版社:高等教育出版社
- 高等教育出版社
- 9787040592344
- 1版
- 464586
- 60250056-3
- 平装
- 16开
- 2023-07-24
- 410
- 328
- 大数据管理与应用
- 本科
随着信息技术、移动商务和社交媒体的蓬勃发展,大数据在各行业的应用变得越来越广泛,正深刻改变着我们的生活和工作方式。使用智能分析技术对大数据进行深入理解与洞察,将使数据这种新型生产要素的价值得到更加充分的发挥。本书旨在遵循数据分析的思路与逻辑,系统梳理大数据智能分析的相关知识。全书共分为绪论和16 章内容。在理论和方法方面,主要包括常规数据预处理、数据降维、特征选择、决策树、K 近邻学习、支持向量机、贝叶斯学习、集成学习、关联规则、聚类、人工神经网络、深度学习、推荐系统等;在理论与实践融合方面,本书提供了若干典型应用场景,如广告点击率预测、信息流中的内容推荐、游戏运营中的数据挖掘等,以期加强读者对理论的理解和应用能力。另外,本书在章后提供了即测即评二维码,帮助读者掌握和巩固对应章节的知识。
本书是新文科·大数据管理与应用专业系列教材之一,也是工业和信息化部“十四五”规划教材。
本书适合作为高等院校大数据管理与应用、数据科学与大数据技术、大数据技术与应用等相关专业的基础教材或教学参考书,也可用作职业培训及相关技术和研究人员的参考用书。
前辅文
绪论
0.1 为什么学习大数据智能分析
0.2 数据的智能化发展
0.3 大数据智能分析理论和方法的基本内容
0.4 大数据智能分析的价值
关键术语
本章小结
即测即评
参考文献
第1章 常规数据预处理
1.1 数据预处理的目的
1.2 数据清洗
1.3 数据集成
1.4 数据变换
1.5 数据归约
1.6 案例分析:基于大规模开放在线课程平台MOOC 的学生信息数据清洗
关键术语
本章小结
即测即评
参考文献
第2章 数据降维
2.1 主成分分析
2.2 奇异值分解
2.3 多维缩放
2.4 等度量映射
2.5 局部线性嵌入算法
2.6 相关方法的推导过程
2.7 案例分析:基于PCA 方法的人脸特征提取
关键术语
本章小结
即测即评
参考文献
第3章 特征选择
3.1 特征选择概述
3.2 过滤式特征选择
3.3 包裹式特征选择
3.4 嵌入式特征选择
3.5 案例分析:Lending Club 信贷违约预测的特征集选择
关键术语
本章小结
即测即评
参考文献
第4章 决策树
4.1 决策树概述
4.2 特征选择
4.3 决策树生成
4.4 树的修剪
4.5 案例分析:电信行业客户流失分析
关键术语
本章小结
即测即评
参考文献
第5章 K 近邻学习
5.1 基本概念及原理
5.2 预测算法
5.3 K 近邻算法的三个基本要素
5.4 K 近邻算法的特点
5.5 K 近邻算法的改进
5.6 案例分析:基于K 近邻算法预测明天是否会降雨
关键术语
本章小结
即测即评
参考文献
第6章 支持向量机
6.1 支持向量机概述
6.2 数据线性可分的情况——线性SVM
6.3 数据非线性可分的情况——非线性SVM
6.4 应用SVM 进行模式分类
6.5 应用SVM 进行非线性回归
6.6 案例分析:基于SVM 预测鸢尾花种类
关键术语
本章小结
即测即评
参考文献
第7章 贝叶斯学习
7.1 朴素贝叶斯分类器
7.2 半朴素贝叶斯分类器
7.3 贝叶斯网络
7.4 案例分析:基于贝叶斯学习判断文章的作者归属
关键术语
本章小结
即测即评
参考文献
第8章 集成学习
8.1 集成学习简介
8.2 Boosting
8.3 Bagging
8.4 随机森林
8.5 案例分析:基于不同集成学习方法预测波士顿地区房价
关键术语
本章小结
即测即评
参考文献
第9章 关联规则
9.1 关联规则的概念
9.2 关联规则算法
9.3 案例分析:沃尔玛的蛋挞与飓风用品营销方案
关键术语
本章小结
即测即评
参考文献
第10章 聚类
10.1 聚类概述
10.2 划分聚类算法K-Means
10.3 层次聚类算法AGNES 和DIANA
10.4 密度聚类算法DBSCAN
10.5 案例分析:零售电商用户画像构建
关键术语
本章小结
即测即评
参考文献
第11章 人工神经网络
11.1 从生物神经网络开始
11.2 感知器
11.3 感知器的训练
11.4 多层神经网络和反向传播
11.5 其他形式的神经网络
11.6 案例分析:利用Lending Club数据预测借款人违约概率
关键术语
本章小结
即测即评
参考文献
第12章 深度学习
12.1 深度学习概述
12.2 卷积神经网络
12.3 其他类型的深度学习神经网络
12.4 案例分析:图像纹理转移问题
关键术语
本章小结
即测即评
参考文献
第13章 推荐系统
13.1 推荐系统概述
13.2 基于内容的推荐
13.3 基于用户的协同过滤
13.4 基于物品的协同过滤
关键术语
本章小结
即测即评
参考文献
第14章 广告点击率预测
14.1 搜索引擎商业模式
14.2 广告点击率预测
14.3 CTR 预测机器学习模型的发展
关键术语
本章小结
第15章 信息流中的内容推荐
15.1 信息流产品商业生态
15.2 信息流推荐系统
15.3 推荐系统的信息茧房和冷启动的问题
关键术语
本章小结
第16章 游戏运营中的数据挖掘
16.1 游戏中的智能化运营场景
16.2 游戏运营中的新增用户
16.3 游戏运营中的流失用户干预
16.4 游戏运营中的商业化
关键术语
本章小结