数据科学的统计学方法
作者: 唐年胜,崔恒建,朱仲义等
出版时间:2024-07-03
出版社:高等教育出版社
- 高等教育出版社
- 9787040616910
- 1版
- 518734
- 44258384-5
- 平装
- 16开
- 2024-07-03
- 450
- 404
- 统计学
- 数据科学与大数据技术
- 本科
本书是一本统计学思想方法论教材,主要讲述数据科学的现代统计学方法。全书内容分五大部分:回归分析、多元统计分析、非参数统计分析、时间序列分析、因果分析,通过介绍处理和分析多元或高维变量之间的相关关系、时序关系、因果关系的统计思想方法以及非参数统计分析方法,培养学生处理大数据背景下所面临的新的数据分析问题的能力。
本书可作为高等学校数据科学专业、统计学类相关专业,以及人工智能、机器学习、计算机科学、数学优化和运筹等方向的本科生或研究生教材或教学参考书,同时可供相关领域研究人员参考使用。
前辅文
第一部分 回归分析
第一章 回归分析
1.1 什么是回归分析
1.2 回归分析的主要内容
1.3 回归分析在数据分析中的地位和作用
习题一
第二章 线性回归分析
2.1 一元线性回归分析
2.1.1 一元线性回归模型的基本形式
2.1.2 最小二乘估计
2.1.3 最大似然估计
2.1.4 显著性检验
2.1.5 预测
2.2 多元线性回归分析
2.2.1 多元线性回归模型的基本形式
2.2.2 最小二乘估计
2.2.3 最大似然估计
2.2.4 估计量的性质
2.2.5 显著性检验
2.3 变量选择
2.3.1 最优子集选择法
2.3.2 自变量选择方法
2.4 模型诊断方法
2.4.1 异常点和强影响点的诊断
2.4.2 异方差性诊断
2.4.3 自相关性诊断
2.4.4 多重共线性诊断
习题二
第三章 高维线性回归分析
3.1 高维线性回归模型
3.2 稀疏建模与参数估计
3.2.1 岭回归
3.2.2 LASSO回归
3.2.3 弹性网络回归
3.2.4 SCAD回归
3.2.5 MCP回归
3.3 特征筛选
3.3.1 SIS特征筛选
3.3.2 DC-SIS特征筛选
习题三
第四章 逻辑斯谛回归
4.1 逻辑斯谛回归与分类
4.1.1 分类与回归的关系
4.1.2 逻辑斯谛回归
4.2 逻辑斯谛回归的统计推断
4.2.1 最大似然估计及其算法
4.2.2 显著性检验
4.2.3 拟合优度检验
4.2.4 预测与应用
4.3 多值响应分析方法
4.3.1 无序多分类逻辑斯谛回归
4.3.2 有序多分类逻辑斯谛回归
习题四
参考文献
第二部分 多元统计分析
第五章 高维均值与协方差矩阵
5.1 高维分布
5.1.1 概率分布与边缘分布
5.1.2 条件分布与独立性
5.1.3 高维正态分布
5.1.4 退化的高维正态分布
5.1.5 高维椭球等高分布
5.1.6 高维均值与协方差矩阵
5.1.7 高维正态分布的性质
5.2 高维均值与协方差的估计
5.2.1 矩法估计
5.2.2 最大似然估计
5.2.3 估计量的性质
5.2.4 最优线性预测
5.3 高维均值与协方差矩阵的假设检验
5.3.1 威沙特分布与霍特林T2分布
5.3.2 单总体均值向量的检验
5.3.3 两总体均值向量的检验
5.3.4 高维协方差矩阵的检验
习题五
第六章 主成分分析
6.1 高维变量降维与主成分
6.1.1 总体主成分
6.1.2 总体新成分性质
6.1.3 总体主成分贡献率
6.1.4 标准化变换下的主成分
6.2 数据降维与样本主成分
6.2.1 样本主成分
6.2.2 由S提取主成分
6.2.3 由R提取主成分
6.3 稳健主成分分析
6.4 主成分分析的应用
习题六
第七章 因子分析
7.1 潜在变量分析与因子模型
7.1.1 统计模型
7.1.2 因子模型的性质
7.1.3 因子载荷矩阵性质
7.2 因子分析的基本方法
7.2.1 因子载荷矩阵和特殊方差矩阵估计方法
7.2.2 因子旋转
7.2.3 因子得分
习题七
第八章 判别分析
8.1 距离判别
8.1.1 两总体距离判别与线性判别
8.1.2 两总体距离判别与二次判别
8.1.3 多总体距离判别
8.2 贝叶斯判别
8.2.1 最大后验概率判别
8.2.2 最小期望误判损失与似然比判别
8.3 费希尔判别
8.4 神经网络判别方法
8.4.1 BP神经网络
8.4.2 BP神经网络判别与R语言实现
8.4.3 支持向量机
8.4.4 应用判别分析案例
习题八
第九章 聚类分析
9.1 距离和相似系数
9.1.1 距离
9.1.2 相似系数
9.2 系统聚类法
9.2.1 系统聚类法的基本思想与过程
9.2.2 最短距离法
9.2.3 最长距离法
9.2.4 类平均法
9.2.5 可变类平均法
9.2.6 中间距离法
9.2.7 可变中间距离法
9.2.8 重心法
9.2.9 离差平方和
9.2.10 系统聚类法的统一
9.2.11 类的个数
9.3 动态聚类法
9.3.1 K均值法及其聚类步骤
9.3.2 基于密度的聚类
9.3.3 基于密度峰值的聚类
习题九
参考文献
第三部分 非参数统计分析
第十章 非参数回归
10.1 非参数统计
10.1.1 非参数统计基本方法
10.1.2 密度估计方法
10.2 非参数检验方法
10.2.1 符号秩和检验法
10.2.2 Wilcoxon秩和检验法
10.2.3 列联表检验
10.3 相关性分析方法
10.3.1 Spearman-秩相关系数
10.3.2 Kendall-r相关系数
10.3.3 Kendall协和系数
10.4 非参数回归方法
10.4.1 核回归方法
10.4.2 现代非参数回归简介
习题十
参考文献
第四部分 时间序列分析
第十一章 时间序列分析
11.1 平稳时间序列
11.1.1 时间序列的例子
11.1.2 平稳性定义及性质
11.1.3 平稳ARMA时间序列
11.1.4 平稳序列的预报
11.2 ARMA模型的统计建模与预报
11.2.1 自协方差函数的估计
11.2.2 ARMA(p,q)模型的参数估计与定阶
11.2.3 ARMA序列的预报
11.3 高维自回归模型
11.3.1 多维自回归模型及其统计推断
11.3.2 高维自回归模型及其建模
习题十一
参考文献
第五部分 因果分析
第十二章 因果推断
12.1 混杂因素与尤尔-辛普森悖论
12.1.1 尤尔-辛普森悖论
12.1.2 判断混杂因素的可压缩性准则
12.1.3 潜在结果模型
12.1.4 判断混杂因素的可比较性准则
12.2 因果作用的估计方法
12.2.1 分层分析与标准化方法
12.2.2 匹配方法和倾向得分
12.2.3 逆概加权估计和回归估计
12.2.4 双稳健估计
12.2.5 工具变量方法
12.2.6 因果作用的上下界
12.3 因果网络
12.3.1 因果网络模型
12.3.2 基于因果网络的因果作用评价
12.3.3 多混杂因素的筛选方法
12.3.4 因果网络的结构学习
参考文献