- 高等教育出版社
- 9787040583557
- 1版
- 432024
- 44258382-9
- 平装
- 16开
- 2022-07
- 300
- 304
- 理学
- 统计学
- 数据科学与大数据技术
- 本科
本书是为数据科学与大数据技术专业编写的统计学基础课教材,主要内容包括探索性数据分析、统计推断的估计方法、统计假设检验、数据获取与抽样调查、试验设计与因果推断简介等。全书首先从统计的基本规范谈起,讲述数据的信息汇总,并直观呈现;然后讲述统计推断内容,将数据提升到分布层面;最后讲述获取数据的两种方式,并嵌入因果推断知识。内容丰富,富有数据科学时代气息。
本书可作为高等学校数据科学专业、统计学类相关专业本科生统计学课程教材或教学参考书,也可供从事大数据分析、人工智能、统计学、机器学习、图像和信号处理、计量经济学等领域的科技工作者参考。
前辅文
第一章 探索性数据分析
1.1 如何看数据
1.1.1 与数据相关的基本概念
1.1.2 统计学规范
1.1.3 数据预处理
1.2 描述性统计
1.2.1 单变量情况
1.2.2 多变量情况
1.2.3 回归与曲线拟合
1.3 数据可视化
1.3.1 数据可视化的概念与规范
1.3.2 单变量的数据可视化
1.3.3 变量间关系的数据可视化
1.3.4 一份完整的分析报告
习题一
第二章 统计推断中的估计方法
2.1 概率论基础
2.1.1 概率模型
2.1.2 随机变量
2.1.3 随机变量的数字特征
2.2 统计量的分布
2.2.1 统计量及其分布
2.2.2 一般总体的渐近分布
2.3 点估计与区间估计
2.3.1 参数估计的基本概念
2.3.2 矩估计、最大似然估计、M-估计以及迭代算法
2.3.3 点估计的评价准则
2.3.4 区间估计
2.4 贝叶斯方法
2.4.1 贝叶斯推断
2.4.2 先验的选择
2.4.3 两个例子
2.5 自助法
2.5.1 非参数自助法与参数自助法
2.5.2 利用自助法估计统计量精度
2.5.3 自助法在机器学习中的应用
习题二
第三章 统计假设检验
3.1 假设检验问题概述
3.1.1 费希尔显著性检验思想
3.1.2 基本概念
3.1.3 p 值
3.2 正态总体参数的检验
3.2.1 均值检验
3.2.2 方差检验
3.2.3 两样本情形
3.3 NP引理和最大功效检验
3.3.1 基本概念
3.3.2 NP引理
3.3.3 一致最大功效检验
3.4 似然比检验
3.4.1 基本方法
3.4.2 威尔克斯定理
3.4.3 序贯概率比检验
3.4.4 最优性
3.5 常用的分布检验方法
3.5.1 皮尔逊X2拟合优度检验
3.5.2 列联表的独立性检验
3.5.3 柯尔莫哥洛夫检验
3.5.4 正态性检验
3.6 经验似然检验
3.6.1 简单一元情形
3.6.2 多元情形
3.7 多重检验和错误发现率
习题三
第四章 数据获取与抽样调查
4.1 数据获取的重要意义
4.2 获取数据的两种基本范式
4.3 抽样调查的基本框架
4.4 简单随机抽样
4.4.1 抽样方法和基本性质
4.4.2 基于目标变量样本信息的估计方法
4.4.3 综合相关变量信息的估计方法
4.4.4 区间估计与样本量的确定
4.5 分层抽样
4.5.1 分层抽样的基本框架
4.5.2 在分层抽样中确定各层样本量的方法
4.5.3 分层抽样下的估计方法
4.6 整群抽样
4.7 非概率抽样
习题四
第五章 试验设计与因果推断简介
5.1 奈曼—鲁宾因果模型简介
5.1.1 潜在结果与随机化试验
5.1.2 奈曼—鲁宾因果模型的应用
5.2 基于随机化试验的因果推断
5.2.1 完全随机化试验下的因果推断
5.2.2 分层随机化试验下的因果推断
5.3 包含协变量的随机化试验
5.4 随机化试验中的协变量不平衡
5.5 重新随机化思想和方法简介
习题五
参考文献