SPSS统计分析高级教程(第2版)
作者: 张文彤 董伟
出版时间:2013-03
出版社:高等教育出版社
- 高等教育出版社
- 9787040369960
- 2
- 78658
- 40180894-4
- 平装
- 16开
- 2013-03
- 710
- 451
本书以IBM SPSS Statistics 20 中文版为基础,全面、系统地介绍了各种多变量统计模型、多元统计分析模型、智能统计分析方法的原理和软件实现。在书中作者结合自身多年的统计分析实战和SPSS 行业应用经验,侧重于对统计新方法、新观点的讲解。在保证统计理论严谨的同时,又充分注重了文字的浅显易懂,使本书更加易学易用。
本书是一本如何使用SPSS进行高级统计分析的指导书。读者可在下载书中案例数据,从而完整地重现全部分析内容,并可进一步在新浪微博与作者、其他读者进行讨论。
本书适合于已具备统计分析基础知识的读者阅读,可作为高等学校各专业高年级本科生、研究生的统计学教材或参考书,以及市场营销、金融、财务、人力资源管理等行业中需要做数据分析的人士,或从事咨询、研究、分析等专业人士的参考书。
第一部分 一般线性模型、混合线性模型和广义线性模型
第1章 方差分析模型
1.1 模型简介
1.1.1 模型入门
1.1.2 常用术语
1.1.3 适用条件
1.2 案例:胶合板磨损深度的比较
1.2.1 操作说明
1.2.2 结果解释
1.2.3 模型参数的估计值
1.2.4 两两比较
1.2.5 其他常用选项
1.3 两因素方差分析模型
1.3.1 案例:超市规模、货架位置与销量的关系
1.3.2 边际均值与轮廓图
1.3.3 拟合劣度检验
1.4 因素各水平间的精细比较
1.4.1 POSTHOC子句
1.4.2 EMMEANS子句
1.4.3 LMATRIX子句和KMARIX子句
1.4.4 CONSTRAST子句
1.5 方差分析模型进阶
1.5.1 随机因素的方差分析模型
1.5.2 自定义效应检验使用的误差项
1.5.3 四类方差分解方法
思考与练习
参考文献
第2章 常用实验设计分析方法
2.1 仅研究主效应的实验设计方案
2.1.1 完全随机设计
2.1.2 配伍设计
2.1.3 交叉设计
2.1.4 拉丁方设计
2.2 考虑交互作用的实验设计方案
2.2.1 析因设计
2.2.2 正交设计
2.2.3 均匀设计
2.3 误差项变动的特殊实验设计方案
2.3.1 嵌套设计
2.3.2 重复测量设计
2.3.3 裂区设计
2.4 协方差分析
2.4.1 协方差分析的必要性
2.4.2 平行性假定的检验
2.4.3 计算和检验修正均值
思考与练习
参考文献
第3章 多元方差分析与重复测量方差分析
3.1 多元方差分析
3.1.1 模型简介
3.1.2 案例:教育模式比较
3.1.3 对案例的进一步分析
3.2 重复测量资料的方差分析
3.2.1 模型简介
3.2.2 案例:促销效果研究
思考与练习
参考文献
第4章 线性混合模型
4.1 模型简介
4.1.1 问题的提出
4.1.2 模型入门
4.2 层次聚集性数据案例
4.2.1 拟合基本模型结构
4.2.2 在固定效应中加入自变量
4.2.3 在随机效应中加入自变量
4.2.4 更多解释变量的引入
4.2.5 其他常用选项
4.3 重复测量数据案例
4.3.1 对数据的初步分析
4.3.2 拟合基本模型结构
4.3.3 考虑重复测量间的相关性
4.3.4 更改对测量间相关性的假定
4.3.5 模型中可用的相关阵种类
4.4 线性混合模型进阶
4.4.1 线性混合模型的用途
4.4.2 线性混合模型与一般线性模型的联系
思考与练习
参考文献
第5章 广义线性模型、广义估计方程和广义线性混合模型
5.1 广义线性模型
5.1.1 模型简介
5.1.2 案例分析
5.2 广义估计方程
5.2.1 方程简介
5.2.2 案例分析
5.3 广义线性混合模型
5.3.1 模型简介
5.3.2 案例分析
思考与练习
参考文献
第二部分 回归模型
第6章 多重线性回归模型
6.1 模型简介
6.1.1 基本概念
6.1.2 分析步骤
6.2 案例:销量影响因素分析
6.2.1 基本分析结果
6.2.2 回归模型的假设检验
6.2.3 偏回归系数的假设检验
6.2.4 标准化偏回归系数
6.2.5 衡量回归模型优劣的标准
6.3 回归预测、区间估计与残差分析
6.3.1 模型预测值
6.3.2 模型的区间估计
6.3.3 模型的残差
6.3.4 利用残差考察模型适用条件
6.4 逐步回归
6.4.1 筛选自变量的基本原则
6.4.2 常用的逐步回归方法
6.4.3 案例:固体垃圾排放量与土地种类的关系
6.5 模型的进一步诊断与修正
6.5.1 强影响点的识别与处理
6.5.2 多重共线性的识别与处理
6.5.3 回归模型结果解释时应注意的问题
6.6 自动线性建模
6.6.1 界面说明
6.6.2 案例:生成更高精度的预测模型
思考与练习
参考文献
第7章 线性回归的衍生模型
7.1 非直线趋势的处理:曲线直线化
7.1.1 模型简介
7.1.2 案例:通风时间和毒物浓度的曲线方程
7.1.3 使用曲线估计过程分析
7.2 方差不齐的处理:加权最小二乘法
7.2.1 模型简介
7.2.2 案例:不等量样品数据的回归方程
7.2.3 使用WLS过程分析
7.3 共线性的处理:岭回归
7.3.1 模型简介
7.3.2 案例:用外形指标推测胎儿周龄
7.4 分类变量的数值化:最优尺度回归
7.4.1 模型简介
7.4.2 案例:生育子女数的回归模型
7.4.3 应用最优尺度方法注意事项
思考与练习
参考文献
第8章 路径分析入门
8.1 两阶段最小二乘法
8.1.1 模型简介
8.1.2 案例:人口背景资料对收入的影响
8.1.3 使用2SLS过程进行分析
8.2 路径分析入门
8.2.1 模型简介
8.2.2 案例:住院费用影响因素研究
8.3 偏最小二乘法入门
8.3.1 模型简介
8.3.2 软件实现
思考与练习
参考文献
第9章 非线性回归模型
9.1 模型简介
9.1.1 问题的提出
9.1.2 模型框架
9.2 案例:通风时间和毒物浓度的曲线方程
9.2.1 操作说明
9.2.2 结果解释
9.2.3 对模型的进一步分析
9.3 自定义损失函数:最小一乘法
9.4 分段回归模型的拟合
9.5 非线性回归模型进阶
9.5.1 参数初始值的设定
9.5.2 模型的拟合方法
思考与练习
参考文献
第10章 二分类Logistic回归模型
10.1 模型简介
10.1.1 模型入门
10.1.2 基本概念
10.2 案例:低出生体重儿影响因素研究
10.3 分类自变量的定义与比较方法
10.3.1 使用哑变量的必要性
10.3.2 SPSS中预设的哑变量编码方式
10.3.3 设置哑变量时的注意事项
10.4 自变量的筛选方法与逐步回归
10.4.1 模型中的假设检验方法
10.4.2 SPSS中提供的自变量筛选方法
10.4.3 案例:低体重儿数据的逐步回归
10.5 模型拟合效果与拟合优度检验
10.5.1 模型效果的判断指标
10.5.2 拟合优度检验
10.6 模型的诊断与修正
10.6.1 残差分析
10.6.2 多重共线性问题
思考与练习
参考文献
第11章 多分类、配对Logistic回归与Probit回归模型
11.1 有序多分类Logistic回归模型
11.1.1 模型简介
11.1.2 案例:工作满意度影响因素分析
11.1.3 模型适用条件的考察
11.2 无序多分类Logistic回归模型
11.2.1 模型简介
11.2.2 案例:不同背景人群的选举倾向
11.3 1:1配对Logistic回归
11.3.1 模型简介
11.3.2 案例:雌激素与患子宫内膜癌的关系
11.4 Probit回归模型
11.4.1 模型简介
11.4.2 案例一:与Logistic模型比较
11.4.3 案例二:计算LD50
思考与练习
参考文献
第12章 对数线性模型与Poisson回归模型
12.1 对数线性模型简介
12.1.1 模型入门
12.1.2 软件实现
12.2 一般对数线性模型
12.2.1 初步分析
12.2.2 对案例的进一步分析
12.3 因果关系明确时的对数线性模型
12.4 对数线性模型的选择
12.4.1 模型的选择策略
12.4.2 案例分析
12.5 对数线性模型与其他模型的关系
12.5.1 与方差分析模型的关系
12.5.2 与Logistic回归的关系
12.6 Poisson回归模型
12.6.1 模型简介
12.6.2 案例:冠心病死亡与吸烟的关系
思考与练习
参考文献
第三部分 多元统计分析方法
第13章 主成分分析、因子分析与多维偏好分析
13.1 主成分分析
13.1.1 模型简介
13.1.2 案例:各省经济发展情况综合评价
13.2 因子分析
13.2.1 模型简介
13.2.2 案例:对各省经济数据的进一步分析
13.3 因子分析进阶
13.3.1 公因子提取方法
13.3.2 相关阵和协方差
13.3.3 如何确定公因子数量
13.3.4 主成分分析和因子分析的比较
13.4 分类数据的主成分分析(多维偏好分析)
13.4.1 模型简介
13.4.2 界面说明
13.4.3 案例:汽车偏好研究
思考与练习
参考文献
第14章 对应分析
14.1 模型简介
14.1.1 问题的提出
14.1.2 模型入门
14.1.3 软件实现
14.2 案例:头发颜色与眼睛颜色的关联
14.2.1 预分析
14.2.2 正式分析
14.2.3 分析结果的正确解释
14.2.4 对案例的进一步分析
14.3 基于均数的对应分析
14.3.1 方法原理
14.3.2 案例:各省城市市政工程建设状况的对应分析
14.4 对应分析进阶
14.4.1 特殊类别的处理
14.4.2 对应分析与因子分析的关系
14.4.3 对应分析的优势与劣势
14.5 基于最优尺度变换的多重对应分析
14.5.1 方法原理
14.5.2 案例:汽车用户背景资料的对应分析
思考与练习
参考文献
第15章 典型相关分析
15.1 模型简介
15.1.1 基本思想
15.1.2 数学描述
15.2 案例:体力指标和运动能力指标的相关分析
15.2.1 两组变量间的相关系数
15.2.2 典型相关系数及显著性检验
15.2.3 典型变量的系数
15.2.4 典型结构分析
15.2.5 典型冗余分析
15.3 典型相关分析进阶
15.3.1 如何应用典型相关分析
15.3.2 如何理解典型相关分析的结果
15.3.3 对应分析与典型相关分析的等价性
15.3.4 典型相关分析和因子分析的关系
15.4 基于最优尺度变换的非线性典型相关分析
15.4.1 方法原理
15.4.2 案例:多重对应分析数据的再分析
思考与练习
参考文献
第16章 多维尺度分析
16.1 不考虑个体差异的MDS模型
16.1.1 模型简介
16.1.2 案例:城市间的地面距离
16.1.3 距离的各种提供方式
16.2 考虑个体差异的MDS模型
16.2.1 模型简介
16.2.2 案例:饮料的口味差异评价
16.2.3 模型结果的解释与优化
16.3 基于最优尺度变换的MDS模型
16.3.1 模型简介
16.3.2 界面说明
16.3.3 案例:用PROXCAL过程分析饮料数据
16.3.4 在模型中考虑更多维度
16.4 多维展开模型
16.4.1 模型简介
16.4.2 案例:场景和行为间的匹配关系
思考与练习
参考文献
第17章 聚类分析
17.1 模型简介
17.1.1 问题的提出
17.1.2 聚类分析入门
17.1.3 聚类分析的方法体系
17.2 K-均值聚类法
17.2.1 方法原理
17.2.2 案例:移动通信客户细分
17.3 层次聚类法
17.3.1 方法原理
17.3.2 案例:体操裁判打分倾向聚类
17.3.3 对层次聚类法的进一步讨论
17.4 两步聚类法
17.4.1 方法原理
17.4.2 案例:病例数据的聚类分析
17.5 聚类分析进阶
17.5.1 如何选择聚类方法
17.5.2 聚类结果的检验
17.5.3 聚类结果的解释和描述
17.5.4 聚类分析中应该注意的其他问题
思考与练习
参考文献
第18章 经典判别分析
18.1 模型简介
18.1.1 基本原理
18.1.2 适用条件
18.1.3 判别效果的评价
18.1.4 分析步骤
18.2 案例:鸢尾花种类判别
18.2.1 操作说明
18.2.2 结果解释
18.2.3 判别结果的图形化展示
18.2.4 判别效果的验证
18.2.5 将模型用于新样品分类
18.2.6 适用条件的判断
18.3 贝叶斯判别分析
18.3.1 方法原理
18.3.2 软件实现
18.4 判别分析进阶
18.4.1 逐步判别分析
18.4.2 判别分析和因子分析的相似性和差异
18.4.3 两类判别和多重回归的等价性
思考与练习
参考文献
第19章 智能判别分析方法:树模型与最近邻元素法
19.1 树模型简介
19.1.1 问题的提出
19.1.2 模型入门
19.1.3 模型特点
19.2 案例:移动客户流失预测
19.2.1 操作说明
19.2.2 结果解释
19.3 对案例的进一步分析
19.3.1 各自变量的重要性
19.3.2 考虑应用模型时的成本与收益
19.3.3 考虑进一步细分和剪枝
19.3.4 将模型输出为判别程序
19.4 其他树模型算法
19.4.1 CHAID算法和穷举CHAID算法
19.4.2 CRT算法
19.4.3 QUEST算法
19.5 最近邻元素法
19.5.1 模型简介
19.5.2 案例:鸢尾花种类判别
19.5.3 KNN模型的本质
思考与练习
参考文献
第20章 智能判别分析方法:神经网络
20.1 模型简介
20.1.1 基本原理
20.1.2 注意事项
20.2 案例:对低出生体重儿案例的重新分析
20.3 对案例的进一步分析
20.3.1 模型效果的图形观察
20.3.2 尝试将模型复杂化
20.3.3 纳入更多候选自变量
20.4 径向基神经网络
20.4.1 基本原理
20.4.2 分析案例
思考与练习
参考文献
第四部分 其他统计分析方法
第21章 信度分析
21.1 信度理论入门
21.1.1 真分数测量理论
21.1.2 信度与效度
21.1.3 内在信度与外在信度
21.1.4 信度的判断标准
21.2 案例:问卷信度分析
21.2.1 Alpha信度系数
21.2.2 对各题目的进一步分析
21.2.3 对真分数理论适用条件的考察
21.3 其余常用的信度系数
21.3.1 重测信度
21.3.2 折半信度
21.3.3 Guttman系数
21.3.4 平行模型的信度系数
21.3.5 严格平行模型的信度系数
21.3.6 评分者信度
21.3.7 信度系数总结
21.4 信度理论进阶
21.4.1 真分数测量理论的缺陷
21.4.2 概化理论入门
21.4.3 软件实现
思考与练习
参考文献
第22章 联合分析
22.1 模型简介
22.1.1 为什么使用联合分析
22.1.2 常用术语
22.1.3 分析步骤
22.1.4 软件实现
22.2 联合分析的正交实验设计
22.2.1 生成设计表格
22.2.2 输出设计卡片
22.3 联合分析的数据建模
22.3.1 Conjoint过程语法说明
22.3.2 案例:汽车偏好研究
22.3.3 对案例进一步分析
22.4 联合分析进阶
22.4.1 适应性联合分析
22.4.2 基于选择的联合分析
思考与练习
参考文献
第23章 时间序列模型
23.1 模型简介
23.1.1 基本概念
23.1.2 模型分类
23.1.3 分析步骤
23.1.4 软件实现
23.2 时间序列的建立和平稳化
23.2.1 填补缺失值
23.2.2 定义时间变量
23.2.3 时间序列的平稳化
23.3 时间序列的图形化观察
23.3.1 序列图
23.3.2 自相关图
23.3.3 互相关图
23.4 时间序列的建模与预测
23.4.1 指数平滑简介
23.4.2 ARMA模型简介
23.4.3 案例:NRC数据的建模预测
23.5 季节分解
23.5.1 模型简介
23.5.2 案例:对完整序列NRC2进行季节分解
思考与练习
参考文献
第24章 生存分析
24.1 生存分析简介
24.1.1 生存分析简史
24.1.2 基本概念
24.1.3 生存分析的基本内容
24.1.4 软件实现
24.2 生存函数的估计和检验
24.2.1 生存函数的基本估计方法
24.2.2 Kaplan-Meier法分析案例
24.2.3 寿命表法分析案例
24.2.4 两种方法的比较
24.3 Cox回归模型
24.3.1 模型简介
24.3.2 案例:术中放疗效果分析
24.3.3 模型结果的图形观察
24.4 含时间依存变量的Cox模型
24.4.1 时间依存协变量的种类
24.4.2 用时间依存模型验证比例风险性
24.4.3 用时间依存模型考察内在时间依存变量的影响
24.5 Cox模型进阶
24.5.1 生存分析中的分层变量
24.5.2 用Cox回归过程拟合1:n配伍Logistic回归
24.5.3 竞争风险的Cox模型
思考与练习
参考文献
第25章 缺失值分析
25.1 缺失值理论简介
25.1.1 数据的缺失机制
25.1.2 缺失值的处理方法
25.2 对缺失情况的基本分析
25.2.1 生成缺失数据
25.2.2 缺失模式分析
25.2.3 缺失情况的统计描述
25.3 缺失值填充技术
25.3.1 列表输出
25.3.2 使用回归算法进行填充
25.3.3 使用期望最大化算法进行填充
25.4 多重填充
25.4.1 模型简介
25.4.2 缺失模式分析
25.4.3 缺失值的多重填充
25.4.4 采用填充后数据建模
思考与练习
参考文献
附录1 常见多变量/多元统计分析方法分类
附录2 全书案例及分析模型索引