商业策略数据分析
¥119.00定价
作者: CDA数据科学研究院
出版时间:2024-07
出版社:电子工业出版社
- 电子工业出版社
- 9787121449451
- 1-6
- 466068
- 48253742-0
- 平塑勒
- 16开
- 2024-07
- 570
- 468
- 公共课
- 本科 研究生及以上
内容简介
本书作为 CDA LEVEL Ⅱ考试教材,打破传统的知识整合模式,从 EDIT(探索、诊断、指导和工具)数字化工作模型的角度进行讲解,在介绍知识概念的同时,还讲解了在进行商业策略数据分析时应遵循的整体思维和思考方式,以达到业务宏观分析与用户微观洞察相结合、使用科学的方式进行数据分析的教学目标。 本书分为 5 部分,分别讲解 EDIT 模型、数据处理与可视化、根因分析、业务优化,以及数据治理与数据模型管理。其中第一部分就是第 1 章的内容,第二部分包含第 2 章和第 3 章,第三部分包含第 4~8 章,第四部分包含第 9~11 章,第五部分包含第 12~14 章,每章分别针对当前部分的问题进行分析与处理。
目录
目录__eol__第1 章 EDIT 模型概述. 1__eol__1.1 探索阶段 4__eol__1.2 诊断阶段 5__eol__1.3 指导阶段 8__eol__1.4 工具支持 9__eol__1.5 本章练习题 10__eol____eol__第2 章 数据处理 12__eol__2.1 使用pandas 读取结构化数据 .13__eol__2.1.1 读取数据 .14__eol__2.1.2 写出数据 .17__eol__2.2 数据整合 17__eol__2.2.1 行、列操作 .17__eol__2.2.2 条件查询 .21__eol__2.2.3 横向连接 .24__eol__2.2.4 纵向合并 .27__eol__2.2.5 排序 .30__eol__2.2.6 分组汇总 .31__eol__2.2.7 拆分列 .35__eol__2.2.8 赋值与条件赋值 .36__eol__2.3 数据清洗 39__eol__2.3.1 重复值处理 .39__eol__2.3.2 缺失值处理 .40__eol__2.4 本章练习题 43__eol____eol__第3 章 指标体系与数据可视化. 45__eol__3.1 Python 可视化 45__eol__3.1.1 Matplotlib 绘图库 .45__eol__3.1.2 Seaborn 绘图库.54__eol__3.2 描述性统计分析与绘图 60__eol__3.2.1 描述性统计进行数据探索 .60__eol__3.2.2 制作报表与统计制图 .69__eol__3.2.3 制图的步骤 .76__eol__3.3 指标体系 81__eol__3.3.1 建立指标标准 .82__eol__3.3.2 什么是指标体系 .83__eol__3.3.3 构建指标体系的意义 .85__eol__3.3.4 构建指标库 .86__eol__3.3.5 搭建管理分析视图和指标应用模式 .89__eol__3.4 本章练习题 90__eol____eol__第4 章 数据采集与数据预处理. 92__eol__4.1 数据采集方法 92__eol__4.1.1 市场研究中的数据 .92__eol__4.1.2 概率抽样方法 .93__eol__4.1.3 非概率抽样方法 .99__eol__4.1.4 概率抽样和非概率抽样的比较 .101__eol__4.2 市场调研和数据录入 101__eol__4.2.1 市场调研流程 .101__eol__4.2.2 市场调研目标设定 .102__eol__4.2.3 市场调研前的准备工作 .102__eol__4.2.4 实施调研 .109__eol__4.3 数据预处理基础 110__eol__4.3.1 数据预处理基本步骤 .110__eol__4.3.2 错误数据识别与处理 .111__eol__4.3.3 连续型变量离群值识别与处理 .116__eol__4.3.4 分类型变量概化处理 .117__eol__4.3.5 缺失值处理 .118__eol__4.3.6 连续型变量分布形态转换 .122__eol__4.3.7 连续型变量中心标准化或归一化 .122__eol__4.3.8 变量降维 .123__eol__4.3.9 WoE 转换 124__eol__4.4 本章练习题 125__eol____eol__第5 章 宏观业务分析方法 129__eol__5.1 矩阵分析法 129__eol__5.2 连续型变量降维 134__eol__5.2.1 方法概述 .135__eol__5.2.2 变量筛选 .136__eol__5.2.3 维度归约 .136__eol__5.3 主成分分析法 137__eol__5.3.1 主成分分析简介 .137__eol__5.3.2 主成分分析原理 .138__eol__5.3.3 主成分分析的运用 .141__eol__5.3.4 实战案例:在Python 中实现主成分分析 .142__eol__5.3.5 基于主成分的冗余变量筛选 .145__eol__5.4 因子分析 146__eol__5.4.1 因子分析模型 .146__eol__5.4.2 因子分析算法 .148__eol__5.4.3 实战案例:在Python 中实现因子分析 .151__eol__5.5 多维尺度分析 155__eol__5.6 本章练习题 159__eol____eol__第6 章 用户标签体系与用户画像 165__eol__6.1 标签体系的整体框架 167__eol__6.2 标签的分类 168__eol__6.2.1 从研究客体的数据类型角度分类 .168__eol__6.2.2 从标签的时态角度分类 .170__eol__6.2.3 从标签的加工角度分类 .171__eol__6.2.4 业务指标与用户标签的关系 .175__eol__6.3 用户画像 181__eol__6.3.1 细分市场与STP 模型 182__eol__6.3.2 快速入手用户画像 .182__eol__6.3.3 用户分群的发展历程 .185__eol__6.3.4 用户的决策进程 .186__eol__6.3.5 马斯洛需求理论 .187__eol__6.3.6 用户消费的成本与收益 .187__eol__6.3.7 用户细分的方法 .188__eol__6.3.8 基于用户分群的精准营销 .190__eol__6.3.9 标签与数据科学的过程 .191__eol__6.4 实战案例:用Python 实现用户画像 .192__eol__6.4.1 使用Python 进行用户画像的基础知识 .192__eol__6.4.2 用户画像在诊断阶段中的应用 .192__eol__6.4.3 样本数据集介绍 .193__eol__6.4.4 使用SQL 语句进行数据处理 .195__eol__6.4.5 使用Python 进行用户画像 .198__eol__6.5 本章练习题 202__eol____eol__第7 章 使用统计学方法进行变量有效性测试 205__eol__7.1 假设检验 205__eol__7.1.1 假设检验的基本概念 .206__eol__7.1.2 假设检验中的两类错误 .207__eol__7.1.3 假设检验与区间估计的联系 .209__eol__7.1.4 假设检验的基本步骤 .209__eol__7.1.5 配对样本t 检验211__eol__7.2 方差分析 211__eol__7.2.1 单因素方差分析 .212__eol__7.2.2 多因素方差分析 .217__eol__7.3 列联表分析与卡方检验 220__eol__7.3.1 列联表 .220__eol__7.3.2 卡方检验 .222__eol__7.4 线性回归 224__eol__7.4.1 简单线性回归 .225__eol__7.4.2 多元线性回归 .227__eol__7.4.3 多元线性回归的变量筛选 .236__eol__7.4.4 线性回归模型的经典假设 .239__eol__7.4.5 建立线性回归模型的基本步骤 .248__eol__7.5 Logistic 回归 249__eol__7.5.1 逻辑回归的相关关系分析 .252__eol__7.5.2 逻辑回归模型及实现 .253__eol__7.5.3 逻辑回归的极大似然估计 .264__eol__7.5.4 模型评估 .266__eol__7.5.5 因果推断模型 .274__eol__7.6 本章练习题 278__eol____eol__第8 章 使用时间序列分析方法做预报. 294__eol__8.1 认识时间序列 294__eol__8.2 效应分解法 295__eol__8.2.1 时间序列的效应分解 .296__eol__8.2.2 时间序列3 种效应的组合方式 .296__eol__8.3 平稳时间序列分析ARMA 模型 297__eol__8.3.1 平稳时间序列 .297__eol__8.3.2 ARMA 模型 298__eol__8.3.3 在Python 中进行AR 建模 304__eol__8.4 非平稳时间序列分析ARIMA 模型 .310__eol__8.4.1 差分与ARIMA 模型 .310__eol__8.4.2 在Python 中进行ARIMA 建模 313__eol__8.5 ARIMA 建模方法总结 322__eol__8.6 本章练习题 323__eol____eol__第9 章 用户分群方法 327__eol__9.1 用户细分与聚类 327__eol__9.1.1 用户细分的重要意义 .327__eol__9.1.2 用户细分的不同商业主题 .328__eol__9.2 聚类分析的基本概念 335__eol__9.3 聚类模型的评估 336__eol__9.3.1 轮廓系数 .336__eol__9.3.2 平方根标准误差 .337__eol__9.3.3 R2 .337__eol__9.3.4 ARI 338__eol__9.4 层次聚类 338__eol__9.4.1 层次聚类的算法描述 .338__eol__9.4.2 层次聚类分群数量的确定 .342__eol__9.4.3 层次聚类应用案例 .343__eol__9.4.4 层次聚类的特点 .347__eol__9.5 K-means 聚类算法 .347__eol