- 电子工业出版社
- 9787121142192
- 1-1
- 350717
- 16开
- 2011-11
- 600
- 应用统计学
- 本科 研究生(硕士、EMBA、MBA、MPA、博士)
内容简介
本书面向实际,从实例入手,阐明社会科学统计方法,致力于实例和统计软件的一体化。主要内容包括抽样和测量、描述统计、概率分布、统计推断:估计、统计推断:显著性检验、两组比较、分类变量之间的关联分析、线性回归和相关、多元关系概述、多元回归分析和相关分析、多组比较:方差分析(ANOVA)、组合回归分析和方差分析:定量和分类预测变量、构建多元回归模型、逻辑斯蒂回归:构建分类响应变量、高级统计方法概述。本版增加了许多新练习,强调实际数据的应用。每章后包括配套课后习题及拓展综合练习,便于读者对统计方法的学习和掌握。
目录
目 录
第1章 引言 1
1.1 统计方法论介绍 1
为什么要学习统计 1
数据 2
什么是统计学 3
1.2 描述统计和推断统计 3
总体和样本 4
参数和统计量 5
定义总体:实际总体和概念总体 5
1.3 计算机在统计中的作用 5
统计软件 5
数据文件 6
统计软件的使用和误用 6
1.4 本章概要 7
思考题 7
第2章 抽样和测量 11
2.1 变量及其测度 11
变量 11
定量(数量)变量和分类变量 12
名义、有序和间隔测度尺度 12
有序数据的数量 13
离散型变量和连续型变量 13
2.2 随机化 14
简单随机抽样 15
如何去选择一个简单随机样本 15
用抽样调查收集数据 16
用实验收集数据 17
用观察研究收集数据 17
2.3 抽样变异性和潜在偏差 18
抽样误差 18
抽样偏差:非概率抽样 18
响应偏差 19
无响应偏差:缺失数据 20
偏差类型总结 20
2.4 其他概率抽样方法* 21
系统随机抽样(Systematic Random
Sampling) 21
分层随机抽样(Stratified Random
Sampling) 22
整群抽样(Cluster Sampling) 22
多阶抽样(Multstage Sampling) 23
2.5 本章概要 24
思考题 24
第3章 描述统计 31
3.1 用表和图描述数据 31
相对频数(relative frequency):
分类数据 31
频数分布和条形图:分类数据 32
频数分布:定量数据 33
直方图(histogram) 34
茎叶图(stem-and-leaf plot) 35
比较组 35
总体分布和样本数据分布 36
分布的形状 37
3.2 数据分布的中心描述 37
均值(mean) 38
均值的性质 39
中位数(median) 40
中位数性质 41
中位数与均值的比较 42
众数(mode) 43
众数的性质 43
3.3 数据分布的变异性描述 44
极差(range) 44
标准差(standard deviation) 45
标准差的性质 46
解释标准差的大小 46
3.4 位置量度 49
四分位数和其他百分比 49
测定变异性:四分位数间距 50
箱图:绘制位置的5个数字概括
图形 51
异常值(outlier) 52
离开均值多少个标准差?z分数 53
3.5 二元描述统计 53
响应变量(response variable)和解释
变量(explanatory variable)之间
的关联 53
比较两组是二元分析 54
二元定量数据 54
两个以上变量的分析 55
3.6 样本统计和总体参数 55
3.7 本章概要 56
表、图小结 56
中心量度的小结 56
变异性量度的小结 57
二元描述统计的小结 57
思考题 58
第4章 概率分布 72
4.1 概率介绍 72
概率可视为长期(long-run)相对
频数 72
基本概率规则 73
4.2 离散型和连续型变量的概率分布 74
离散型变量的概率分布 74
连续型变量的概率分布 75
参数描述概率分布 75
4.3 正态概率分布 76
正态尾部概率表 78
正态概率和经验法则 78
求某个尾部概率的z值 79
z分数是离开均值的标准差数 80
标准正态分布 82
4.4 抽样分布描述了统计量如何变化 83
模拟估计过程 83
用抽样分布表示抽样变异 85
重复抽样的抽样分布说明 87
4.5 样本均值的抽样分布 87
的抽样分布的均值和标准误 87
样本量对抽样分布和估计精度的
影响 89
样本均值的抽样分布近似正态 90
4.6 小结:总体、样本数据以及抽样
分布 92
在样本数据分布和抽样分布上
样本量的影响 95
在统计推断中抽样分布的关键作用 95
4.7 本章概要 96
思考题 96
第5章 统计推断:估计 106
5.1 点估计和区间估计 106
参数的点估计 106
无偏和有效点估计 107
均值、标准差和比例的估计量 108
极大似然估计方法* 108
置信区间等于点估计±误差边际
(margin of error) 108
5.2 比例的置信区间 109
样本比例和其标准误 109
大样本比例的置信区间 110
控制置信水平 112
大样本量给出狭窄的区间 113
错误概率=1-置信水平 113
置信水平是长期正确的比例 113
方法的有效性需要大样本量 114
5.3 均值的置信区间 115
估计误差边际的标准误 115
t分布 115
t分布的性质 115
均值置信区间里的t分数 117
置信水平和样本量的作用 118
关于正态总体假定违反的稳健性 119
标准正态是df =无限时的t分布 119
对使用软件的忠告 120
5.4 样本量的选择 120
估计比例的样本量 121
估计比例时的样本量公式 123
估计均值时的样本量 123
在确定样本量中其他要考虑的
因素 124
只有一个小样本该怎么办 125
5.5 中位数和其他参数的置信区间 126
样本中位数对正态数据的
低效率 126
大样本时中位数的置信区间 126
自举法(bootstrap) 128
5.6 本章概要 129
思考题 130
第6章 统计推断:显著性检验 140
6.1 显著性检验的五个部分 140
假定 141
假设 141
检验统计量 141
P值 142
结论 143
6.2 关于一个均值的显著性检验 143
关于一个均值的显著性检验的
五个部分 143
双侧检验与置信区间之间的对应
关系 147
单侧显著性检验 147
单侧H隐含单侧H0 149
单侧检验与双侧检验的选择 149
水平:使用P值做决策 150
违反正态假定的稳健性 151
6.3 一个比例的显著性检验 152
对一个比例显著性检验的五个
部分 152
从不“接受H0” 154
样本量对P值的影响 154
6.4 在检验中的决策和错误类型 155
对决策的第一类型和第二类型
错误 155
拒绝域 155
水平是第一类型错误的概率 156
当P(第一类型错误)下降时,
P(第二类型错误)上升 156
置信区间和检验决策之间的等价
关系 157
对报告的P值做一个决策 158
6.5 显著性检验的局限性 158
统计显著与实际显著 158
显著性检验并不比置信区间有用 159
对显著性检验和P值的曲解 159
6.6 计算P(第二类型错误)* 161
检验使用的 越小P(第二类型
错误)越大 163
检验的功效(势)(power) 163
6.7 关于一个比例的小样本检验——
二项分布* 164
二项分布 164
二项分布的比例 165
二项式检验 167
6.8 本章概要 168
思考题 170
第7章 两组比较 180
7.1 比较两组的预备知识 180
有响应变量和解释变量时的
双变量(二元)分析 180
相依样本和独立样本 181
估计的差异及其标准误 181
参数的比率 183
7.2 分类数据:比较两组比例 183
关于比例差异的置信区间 185
解释一个置信区间比较比例 185
关于2-1的显著性检验 186
列联表和条件概率 187
7.3 定量数据:比较两个均值 187
2-1的置信区间 187
解释一个置信区间比较均值 188
关于2-1的显著性检验 188
在置信区间和检验之间的对应
关系 189
7.4 比较相依样本的均值 189
适用于匹配样本的配对差异得分 189
使用配对差异推断比较均值 191
独立样本与相依样本 193
7.5 比较均值的其他方法* 193
在假定等方差时比较均值 193
完全随机设计与随机区组设计 195
根据软件给出的报表进行推断 195
效应量 196
适用于均值的一个模型 196
7.6 比较比例的其他方法* 197
比较相依比例 197
比较相依比例的麦克尼马尔检验 198
相依比例差异的置信区间 199
比较比例的费歇精确检验 199
比较两个比例的小样本估计 200
7.7 比较两组的非参数统计量* 200
威尔科克森-曼-惠特尼检验 201
效应量:对一个组更好响应的
比例 201
处理有序变量为定量变量 202
7.8 本章概要 203
思考题 205
第8章 分类变量之间的关联分析 217
8.1 列联表 217
百分比比较 218
构建列联表的原则 219
独立和相依 219
8.2 独立性的卡方检验 220
对应于独立的期望频数 220
卡方检验统计量 221
卡方分布 221
需要的样本量 223
用软件进行卡方检验 223
自由度的解释 224
卡方检验和类别处理 224
8.3 残差:检测关联模式 224
残差分析 225
卡方和2×2(四格)表的比例
差异 226
2×2表的标准化残差 227
大于2×2的表需要用卡方 227
8.4 列联表中关联的量度 228
关联的量度 228
比例差异 228
卡方不是对关联的测量 229
优势比(比数比) 229
优势比的性质 230
r×c列联表的优势比* 231
概述r×c表关联的量度 232
8.5 两个有序变量之间的关联* 233
一致和不一致 233
(gamma) 235
是两个有序比例的差异 236
有序量度的公共特性 236
8.6 对有序关联的推断 236
关联量度的置信区间 236
使用 的独立性检验 237
有序检验与皮尔逊卡方检验 238
对其他有序量度的相似推断方法 238
混合的有序——名义列联表 239
8.7 本章概要 239
思考题 240
第9章 线性回归和相关 250
9.1 线性关系 250
线性函数(linear function) 251
解释y的截距和斜率 252
模型是对实际的简单近似 253
9.2 最小平方预测方程 254
散点图描绘数据 254
预测方程 255
异常值对预测方程的影响 256
预测误差被称为残差 258
预测方程有最小平方性质 258
9.3 线性回归模型 259
线性回归函数 260
描述回归直线的变异 260
均方误(差):估计条件变异 261
条件变异往往小于边缘变异 262
9.4 量度线性关联:相关 263
斜率和关联强度 263
相关 264
相关的性质 265
相关暗示向均值回归 265
r2:预测误差减少的比例 267
r2的性质 269
平方和描述条件变异和边缘变异 269
9.5 对斜率和相关系数的推断 269
对统计推断的假定 270
独立性检验 270
斜率的置信区间 273
读懂计算机打印输出结果 274
对相关的推断* 275
缺失值(missing data) 276
9.6 模型的假定及违背 276
哪一个假定是重要的 276
外推是危险的 277
有影响的观测值 277
影响相关的因素 278
有误差项的回归模型* 279
模型和现实 280
9.7 本章概要 281
思考题 282
第10章 多元关系概述 298
10.1 关联关系和因果关系 298
10.2 对其他变量的控制 300
社会学研究中的统计控制 301
统计控制的关联类型 301
警惕隐变量的存在 303
10.3 多变量关系的类型 304
伪关联(spurious association) 304
链关系(chain relationship) 305
多个因果关系 306
抑制变量(suppressor variable) 306
统计的交互作用 307
多变量关系小结 308
混杂作用使得效应难以评估 309
10.4 统计控制中的推断问题 309
分表分析中小样本的影响 309
控制变量的类别影响 309
对照比较和合并的测度 310
10.5 本章概要 310
思考题 311
第11章 多元回归分析和相关分析 319
11.1 多元回归模型 319
多元回归函数 319
回归系数的解释 322
预测方程和残差 323
11.2 多元回归分析计算机输出实例 323
描述双变量关系的散点图 324
对偏相关绘制偏相关图 325
计算机输出结果样例 326
11.3 复相关和R2 328
复相关 328
R2:多元决定系数 329
R和R2的性质 330
多个解释变量的多重共线性 331
11.4 多元回归系数的统计推断 332
检验解释变量的整体影响 332
F分布 333
回归系数的统计推断 334
方差分析表中的变差和均方差* 336
F统计量是均方误差之比 337
F统计量与t统计量之间的关系 337
11.5 预测变量间的交互作用 337
交叉乘积项 338
检验交互作用项 339
中心化解释变量* 340
扩展与限制* 341
11.6 回归模型的比较 341
全模型和简化模型 341
用残差平方和SSE或决定系数
R2值进行模型比较 342
11.7 偏相关* 343
对偏相关系数的解释 344
对偏相关系数平方的解释 344
高阶偏相关系数 346
偏相关系数的统计推断 346
11.8 标准化回归系数 347
标准化回归系数的方法 347
标准化回归系数的性质 348
预测方程的标准化形式* 349
谨慎比较标准化回归系数 349
11.9 本章概要 350
思考题 352
第12章 多组比较:方差分析
(ANOVA) 368
12.1 多个均值的比较:方差分析
F检验 368
对均值比较的F检验的假定 368
组间变异和组内变异 370
F检验统计量是两个方差估计
之比 371
F检验统计量的公式是 371
组内方差估计* 372
组间方差估计 373
方差分析表中的平方和* 373
F检验与多个t检验 374
12.2 均值的多重比较 374
置信区间比较均值 374
大量置信区间的错误率 375
均值多重比较Bonferroni法 375
均值多重比较Tukey法 377
12.3 用回归模型进行方差分析 377
回归中的虚拟变量 377
回归中用方差分析检验比较
均值 379
为什么使用回归分析来做方差
分析呢 379
12.4 双因素方差分析 380
双因素方差分析中的主效应
假设 380
主效应的F检验 381
双因素方差分析的交互效应 382
H0:没有交互效应的F检验 384
12.5 双因素方差分析和回归分析 384
假定没有交互效应的回归模型 384
有交互效应的回归模型 386
偏平方和 387
双因素方差分析的多重比较 387
析因方差分析 388
12.6 重复测量的方差分析* 389
有重复测量的单因素方差分析 389
球形假定和复合对称性 390
相依样本的置信区间比较 391
固定效应和随机效应 391
12.7 一个因素是重复测量的双因素
方差分析* 392
在两个固定效应之一上进行
重复测量 393
在上面分析的基础上构造置信
区间 395
治疗方法的Bonferroni多重比较 396
更复杂的重复测量分析 397
两次以上的重复测量 397
12.8 违背方差分析假定的影响 397
F检验的稳健性 397
Kruskal-Wallis检验:非参数
检验方法 398
12.9 本章概要 398
思考题 399
第13章 组合回归分析和方差分析:
定量和分类预测变量 412
13.1 均值比较和回归直线比较 412
比较回归直线 413
控制x,比较y的均值 413
13.2 有定量和分类预测变量的回归 415
定量和虚拟解释变量 415
对参数的解释:没有交互效应
的模型 416
13.3 定量预测变量和分类预测变量
之间允许交互作用 418
对不同模型的R或R2的比较 419
多个分类和定量预测变量的回归
分析 420
13.4 用定量和分类预测变量进行回归
的统计推断 420
没有交互效应的检验 421
控制x,检验分类变量的效应 422
用方差分析结果进行比较 423
控制分类变量,检验x的效应 423
13.5 修正均值* 424
控制协变量,修正响应变量的
均值 424
比较修正均值 426
图示解释说明修正均值 427
修正均值的多重比较 428
谨慎使用假设的修正均值 430
13.6 本章概要 431
思考题 431
第14章 构建多元回归模型 438
14.1 模型选择过程 438
为模型选择解释变量 438
向后剔除过程 439
向前选择和逐步回归过程 440
自动选择过程的局限性和弊端 442
探索研究与解释性(理论驱动)
研究 442
选择模型的指标:调整R2、预测
的残差平方和Cp 443
14.2 回归诊断 445
检验残差 445
绘制残差与解释变量图 447
时间序列数据 448
检测有影响的观测值:杠杆值 449
检测有影响的观测值:DFFIT和
DFBETA 449
14.3 多重共线性的影响 452
多重共线性扩大了标准误 452
VIF和其他多重共线性指标 453
存在多重共线性的补救措施 454
14.4 广义线性模型 454
非正态分布的响应变量 455
广义线性模型的连接函数 455
响应变量为正态分布的广义
线性模型 456
响应变量服从γ分布的广义
线性模型 457
14.5 非线性关系:多项式回归 458
二次回归模型 459
二次回归模型的说明与拟合 461
非线性效应的描述和推断 462
谨慎使用多项式模型 462
非参数回归* 463
14.6 指数回归和对数转换* 464
对指数回归模型的解释 467
转换预测变量以获取线性 468
14.7 本章概要 469
思考题 469
第15章 逻辑斯蒂回归:构建分类
响应变量模型 479
15.1 逻辑斯蒂回归 479
线性概率模型 479
二分响应变量的逻辑斯蒂回归
模型 480
概率的逻辑斯蒂回归方程 482
对逻辑斯蒂回归模型的解释 482
使用几率和优势比解释 483
15.2 多元逻辑斯蒂回归 484
几率的效应 486
概率的效应 487
15.3 逻辑斯蒂回归模型的统计推断 488
Wald检验和似然比独立性检验 488
多元逻辑斯蒂回归的推断 489
用似然比检验比较逻辑斯蒂回归
模型 490
15.4 定序响应变量的逻辑斯蒂回归模型 491
累积概率和累积概率的logit 491
定序响应变量的累积logit模型 492
对定序响应变量效应的推断 494
响应变量类别选择的恒定性 494
多元模型的扩展 495
逻辑斯蒂回归模型中的定序
预测变量 495
15.5 名义响应变量的逻辑斯蒂模型* 495
基准类别的Logit 496
15.6 分类变量的对数线性模型* 498
三个变量的分层对数线性模型 498
对数线性模型优势比的解释 500
15.7 对列联表构建的模型进行拟合
优度检验* 502
卡方拟合优度统计量 502
标准化残差 503
对数线性模型的拟合优度 504
通过比较G2值来比较模型 504
逻辑斯蒂模型和对数线性模型
之间的联系 505
逻辑斯蒂模型和对数线性模型
之间的区别 505
15.8 本章概要 506
思考题 506
第16章 高级统计方法概述 515
16.1 纵向数据分析* 515
MANOVA:多因变量方差分析 515
带有随机效应的混合效应模型 516
使用随机效应的一维重复测量
方差分析 516
16.2 多层(分层)模型* 518
为两个层上的观测值构建模型 519
16.3 事件历史模型* 520
截尾数据和时变协变量 520
事件的发生率 521
比例风险模型 521
16.4 路径分析* 523
路径图 523
路径系数 524
直接效应和间接效应 525
路径分解 525
对因果模型的一个告诫 527
16.5 因子分析* 527
因子分析模型 528
拟合因子分析模型 528
分类响应变量的潜在分类模型 531
起源和争议 531
16.6 结构方程模型* 532
计量模型 532
结构方程模型 533
协方差结构模型中的特例 533
拟合协方差结构模型 534
检验模型拟合 535
16.7 马尔可夫链* 535
转移概率 536
思考题 537
附录A SPSS和SAS统计分析 539
附录B 奇数练习答案 558
附录C 统计检验临界值表 576
参考文献 582
第1章 引言 1
1.1 统计方法论介绍 1
为什么要学习统计 1
数据 2
什么是统计学 3
1.2 描述统计和推断统计 3
总体和样本 4
参数和统计量 5
定义总体:实际总体和概念总体 5
1.3 计算机在统计中的作用 5
统计软件 5
数据文件 6
统计软件的使用和误用 6
1.4 本章概要 7
思考题 7
第2章 抽样和测量 11
2.1 变量及其测度 11
变量 11
定量(数量)变量和分类变量 12
名义、有序和间隔测度尺度 12
有序数据的数量 13
离散型变量和连续型变量 13
2.2 随机化 14
简单随机抽样 15
如何去选择一个简单随机样本 15
用抽样调查收集数据 16
用实验收集数据 17
用观察研究收集数据 17
2.3 抽样变异性和潜在偏差 18
抽样误差 18
抽样偏差:非概率抽样 18
响应偏差 19
无响应偏差:缺失数据 20
偏差类型总结 20
2.4 其他概率抽样方法* 21
系统随机抽样(Systematic Random
Sampling) 21
分层随机抽样(Stratified Random
Sampling) 22
整群抽样(Cluster Sampling) 22
多阶抽样(Multstage Sampling) 23
2.5 本章概要 24
思考题 24
第3章 描述统计 31
3.1 用表和图描述数据 31
相对频数(relative frequency):
分类数据 31
频数分布和条形图:分类数据 32
频数分布:定量数据 33
直方图(histogram) 34
茎叶图(stem-and-leaf plot) 35
比较组 35
总体分布和样本数据分布 36
分布的形状 37
3.2 数据分布的中心描述 37
均值(mean) 38
均值的性质 39
中位数(median) 40
中位数性质 41
中位数与均值的比较 42
众数(mode) 43
众数的性质 43
3.3 数据分布的变异性描述 44
极差(range) 44
标准差(standard deviation) 45
标准差的性质 46
解释标准差的大小 46
3.4 位置量度 49
四分位数和其他百分比 49
测定变异性:四分位数间距 50
箱图:绘制位置的5个数字概括
图形 51
异常值(outlier) 52
离开均值多少个标准差?z分数 53
3.5 二元描述统计 53
响应变量(response variable)和解释
变量(explanatory variable)之间
的关联 53
比较两组是二元分析 54
二元定量数据 54
两个以上变量的分析 55
3.6 样本统计和总体参数 55
3.7 本章概要 56
表、图小结 56
中心量度的小结 56
变异性量度的小结 57
二元描述统计的小结 57
思考题 58
第4章 概率分布 72
4.1 概率介绍 72
概率可视为长期(long-run)相对
频数 72
基本概率规则 73
4.2 离散型和连续型变量的概率分布 74
离散型变量的概率分布 74
连续型变量的概率分布 75
参数描述概率分布 75
4.3 正态概率分布 76
正态尾部概率表 78
正态概率和经验法则 78
求某个尾部概率的z值 79
z分数是离开均值的标准差数 80
标准正态分布 82
4.4 抽样分布描述了统计量如何变化 83
模拟估计过程 83
用抽样分布表示抽样变异 85
重复抽样的抽样分布说明 87
4.5 样本均值的抽样分布 87
的抽样分布的均值和标准误 87
样本量对抽样分布和估计精度的
影响 89
样本均值的抽样分布近似正态 90
4.6 小结:总体、样本数据以及抽样
分布 92
在样本数据分布和抽样分布上
样本量的影响 95
在统计推断中抽样分布的关键作用 95
4.7 本章概要 96
思考题 96
第5章 统计推断:估计 106
5.1 点估计和区间估计 106
参数的点估计 106
无偏和有效点估计 107
均值、标准差和比例的估计量 108
极大似然估计方法* 108
置信区间等于点估计±误差边际
(margin of error) 108
5.2 比例的置信区间 109
样本比例和其标准误 109
大样本比例的置信区间 110
控制置信水平 112
大样本量给出狭窄的区间 113
错误概率=1-置信水平 113
置信水平是长期正确的比例 113
方法的有效性需要大样本量 114
5.3 均值的置信区间 115
估计误差边际的标准误 115
t分布 115
t分布的性质 115
均值置信区间里的t分数 117
置信水平和样本量的作用 118
关于正态总体假定违反的稳健性 119
标准正态是df =无限时的t分布 119
对使用软件的忠告 120
5.4 样本量的选择 120
估计比例的样本量 121
估计比例时的样本量公式 123
估计均值时的样本量 123
在确定样本量中其他要考虑的
因素 124
只有一个小样本该怎么办 125
5.5 中位数和其他参数的置信区间 126
样本中位数对正态数据的
低效率 126
大样本时中位数的置信区间 126
自举法(bootstrap) 128
5.6 本章概要 129
思考题 130
第6章 统计推断:显著性检验 140
6.1 显著性检验的五个部分 140
假定 141
假设 141
检验统计量 141
P值 142
结论 143
6.2 关于一个均值的显著性检验 143
关于一个均值的显著性检验的
五个部分 143
双侧检验与置信区间之间的对应
关系 147
单侧显著性检验 147
单侧H隐含单侧H0 149
单侧检验与双侧检验的选择 149
水平:使用P值做决策 150
违反正态假定的稳健性 151
6.3 一个比例的显著性检验 152
对一个比例显著性检验的五个
部分 152
从不“接受H0” 154
样本量对P值的影响 154
6.4 在检验中的决策和错误类型 155
对决策的第一类型和第二类型
错误 155
拒绝域 155
水平是第一类型错误的概率 156
当P(第一类型错误)下降时,
P(第二类型错误)上升 156
置信区间和检验决策之间的等价
关系 157
对报告的P值做一个决策 158
6.5 显著性检验的局限性 158
统计显著与实际显著 158
显著性检验并不比置信区间有用 159
对显著性检验和P值的曲解 159
6.6 计算P(第二类型错误)* 161
检验使用的 越小P(第二类型
错误)越大 163
检验的功效(势)(power) 163
6.7 关于一个比例的小样本检验——
二项分布* 164
二项分布 164
二项分布的比例 165
二项式检验 167
6.8 本章概要 168
思考题 170
第7章 两组比较 180
7.1 比较两组的预备知识 180
有响应变量和解释变量时的
双变量(二元)分析 180
相依样本和独立样本 181
估计的差异及其标准误 181
参数的比率 183
7.2 分类数据:比较两组比例 183
关于比例差异的置信区间 185
解释一个置信区间比较比例 185
关于2-1的显著性检验 186
列联表和条件概率 187
7.3 定量数据:比较两个均值 187
2-1的置信区间 187
解释一个置信区间比较均值 188
关于2-1的显著性检验 188
在置信区间和检验之间的对应
关系 189
7.4 比较相依样本的均值 189
适用于匹配样本的配对差异得分 189
使用配对差异推断比较均值 191
独立样本与相依样本 193
7.5 比较均值的其他方法* 193
在假定等方差时比较均值 193
完全随机设计与随机区组设计 195
根据软件给出的报表进行推断 195
效应量 196
适用于均值的一个模型 196
7.6 比较比例的其他方法* 197
比较相依比例 197
比较相依比例的麦克尼马尔检验 198
相依比例差异的置信区间 199
比较比例的费歇精确检验 199
比较两个比例的小样本估计 200
7.7 比较两组的非参数统计量* 200
威尔科克森-曼-惠特尼检验 201
效应量:对一个组更好响应的
比例 201
处理有序变量为定量变量 202
7.8 本章概要 203
思考题 205
第8章 分类变量之间的关联分析 217
8.1 列联表 217
百分比比较 218
构建列联表的原则 219
独立和相依 219
8.2 独立性的卡方检验 220
对应于独立的期望频数 220
卡方检验统计量 221
卡方分布 221
需要的样本量 223
用软件进行卡方检验 223
自由度的解释 224
卡方检验和类别处理 224
8.3 残差:检测关联模式 224
残差分析 225
卡方和2×2(四格)表的比例
差异 226
2×2表的标准化残差 227
大于2×2的表需要用卡方 227
8.4 列联表中关联的量度 228
关联的量度 228
比例差异 228
卡方不是对关联的测量 229
优势比(比数比) 229
优势比的性质 230
r×c列联表的优势比* 231
概述r×c表关联的量度 232
8.5 两个有序变量之间的关联* 233
一致和不一致 233
(gamma) 235
是两个有序比例的差异 236
有序量度的公共特性 236
8.6 对有序关联的推断 236
关联量度的置信区间 236
使用 的独立性检验 237
有序检验与皮尔逊卡方检验 238
对其他有序量度的相似推断方法 238
混合的有序——名义列联表 239
8.7 本章概要 239
思考题 240
第9章 线性回归和相关 250
9.1 线性关系 250
线性函数(linear function) 251
解释y的截距和斜率 252
模型是对实际的简单近似 253
9.2 最小平方预测方程 254
散点图描绘数据 254
预测方程 255
异常值对预测方程的影响 256
预测误差被称为残差 258
预测方程有最小平方性质 258
9.3 线性回归模型 259
线性回归函数 260
描述回归直线的变异 260
均方误(差):估计条件变异 261
条件变异往往小于边缘变异 262
9.4 量度线性关联:相关 263
斜率和关联强度 263
相关 264
相关的性质 265
相关暗示向均值回归 265
r2:预测误差减少的比例 267
r2的性质 269
平方和描述条件变异和边缘变异 269
9.5 对斜率和相关系数的推断 269
对统计推断的假定 270
独立性检验 270
斜率的置信区间 273
读懂计算机打印输出结果 274
对相关的推断* 275
缺失值(missing data) 276
9.6 模型的假定及违背 276
哪一个假定是重要的 276
外推是危险的 277
有影响的观测值 277
影响相关的因素 278
有误差项的回归模型* 279
模型和现实 280
9.7 本章概要 281
思考题 282
第10章 多元关系概述 298
10.1 关联关系和因果关系 298
10.2 对其他变量的控制 300
社会学研究中的统计控制 301
统计控制的关联类型 301
警惕隐变量的存在 303
10.3 多变量关系的类型 304
伪关联(spurious association) 304
链关系(chain relationship) 305
多个因果关系 306
抑制变量(suppressor variable) 306
统计的交互作用 307
多变量关系小结 308
混杂作用使得效应难以评估 309
10.4 统计控制中的推断问题 309
分表分析中小样本的影响 309
控制变量的类别影响 309
对照比较和合并的测度 310
10.5 本章概要 310
思考题 311
第11章 多元回归分析和相关分析 319
11.1 多元回归模型 319
多元回归函数 319
回归系数的解释 322
预测方程和残差 323
11.2 多元回归分析计算机输出实例 323
描述双变量关系的散点图 324
对偏相关绘制偏相关图 325
计算机输出结果样例 326
11.3 复相关和R2 328
复相关 328
R2:多元决定系数 329
R和R2的性质 330
多个解释变量的多重共线性 331
11.4 多元回归系数的统计推断 332
检验解释变量的整体影响 332
F分布 333
回归系数的统计推断 334
方差分析表中的变差和均方差* 336
F统计量是均方误差之比 337
F统计量与t统计量之间的关系 337
11.5 预测变量间的交互作用 337
交叉乘积项 338
检验交互作用项 339
中心化解释变量* 340
扩展与限制* 341
11.6 回归模型的比较 341
全模型和简化模型 341
用残差平方和SSE或决定系数
R2值进行模型比较 342
11.7 偏相关* 343
对偏相关系数的解释 344
对偏相关系数平方的解释 344
高阶偏相关系数 346
偏相关系数的统计推断 346
11.8 标准化回归系数 347
标准化回归系数的方法 347
标准化回归系数的性质 348
预测方程的标准化形式* 349
谨慎比较标准化回归系数 349
11.9 本章概要 350
思考题 352
第12章 多组比较:方差分析
(ANOVA) 368
12.1 多个均值的比较:方差分析
F检验 368
对均值比较的F检验的假定 368
组间变异和组内变异 370
F检验统计量是两个方差估计
之比 371
F检验统计量的公式是 371
组内方差估计* 372
组间方差估计 373
方差分析表中的平方和* 373
F检验与多个t检验 374
12.2 均值的多重比较 374
置信区间比较均值 374
大量置信区间的错误率 375
均值多重比较Bonferroni法 375
均值多重比较Tukey法 377
12.3 用回归模型进行方差分析 377
回归中的虚拟变量 377
回归中用方差分析检验比较
均值 379
为什么使用回归分析来做方差
分析呢 379
12.4 双因素方差分析 380
双因素方差分析中的主效应
假设 380
主效应的F检验 381
双因素方差分析的交互效应 382
H0:没有交互效应的F检验 384
12.5 双因素方差分析和回归分析 384
假定没有交互效应的回归模型 384
有交互效应的回归模型 386
偏平方和 387
双因素方差分析的多重比较 387
析因方差分析 388
12.6 重复测量的方差分析* 389
有重复测量的单因素方差分析 389
球形假定和复合对称性 390
相依样本的置信区间比较 391
固定效应和随机效应 391
12.7 一个因素是重复测量的双因素
方差分析* 392
在两个固定效应之一上进行
重复测量 393
在上面分析的基础上构造置信
区间 395
治疗方法的Bonferroni多重比较 396
更复杂的重复测量分析 397
两次以上的重复测量 397
12.8 违背方差分析假定的影响 397
F检验的稳健性 397
Kruskal-Wallis检验:非参数
检验方法 398
12.9 本章概要 398
思考题 399
第13章 组合回归分析和方差分析:
定量和分类预测变量 412
13.1 均值比较和回归直线比较 412
比较回归直线 413
控制x,比较y的均值 413
13.2 有定量和分类预测变量的回归 415
定量和虚拟解释变量 415
对参数的解释:没有交互效应
的模型 416
13.3 定量预测变量和分类预测变量
之间允许交互作用 418
对不同模型的R或R2的比较 419
多个分类和定量预测变量的回归
分析 420
13.4 用定量和分类预测变量进行回归
的统计推断 420
没有交互效应的检验 421
控制x,检验分类变量的效应 422
用方差分析结果进行比较 423
控制分类变量,检验x的效应 423
13.5 修正均值* 424
控制协变量,修正响应变量的
均值 424
比较修正均值 426
图示解释说明修正均值 427
修正均值的多重比较 428
谨慎使用假设的修正均值 430
13.6 本章概要 431
思考题 431
第14章 构建多元回归模型 438
14.1 模型选择过程 438
为模型选择解释变量 438
向后剔除过程 439
向前选择和逐步回归过程 440
自动选择过程的局限性和弊端 442
探索研究与解释性(理论驱动)
研究 442
选择模型的指标:调整R2、预测
的残差平方和Cp 443
14.2 回归诊断 445
检验残差 445
绘制残差与解释变量图 447
时间序列数据 448
检测有影响的观测值:杠杆值 449
检测有影响的观测值:DFFIT和
DFBETA 449
14.3 多重共线性的影响 452
多重共线性扩大了标准误 452
VIF和其他多重共线性指标 453
存在多重共线性的补救措施 454
14.4 广义线性模型 454
非正态分布的响应变量 455
广义线性模型的连接函数 455
响应变量为正态分布的广义
线性模型 456
响应变量服从γ分布的广义
线性模型 457
14.5 非线性关系:多项式回归 458
二次回归模型 459
二次回归模型的说明与拟合 461
非线性效应的描述和推断 462
谨慎使用多项式模型 462
非参数回归* 463
14.6 指数回归和对数转换* 464
对指数回归模型的解释 467
转换预测变量以获取线性 468
14.7 本章概要 469
思考题 469
第15章 逻辑斯蒂回归:构建分类
响应变量模型 479
15.1 逻辑斯蒂回归 479
线性概率模型 479
二分响应变量的逻辑斯蒂回归
模型 480
概率的逻辑斯蒂回归方程 482
对逻辑斯蒂回归模型的解释 482
使用几率和优势比解释 483
15.2 多元逻辑斯蒂回归 484
几率的效应 486
概率的效应 487
15.3 逻辑斯蒂回归模型的统计推断 488
Wald检验和似然比独立性检验 488
多元逻辑斯蒂回归的推断 489
用似然比检验比较逻辑斯蒂回归
模型 490
15.4 定序响应变量的逻辑斯蒂回归模型 491
累积概率和累积概率的logit 491
定序响应变量的累积logit模型 492
对定序响应变量效应的推断 494
响应变量类别选择的恒定性 494
多元模型的扩展 495
逻辑斯蒂回归模型中的定序
预测变量 495
15.5 名义响应变量的逻辑斯蒂模型* 495
基准类别的Logit 496
15.6 分类变量的对数线性模型* 498
三个变量的分层对数线性模型 498
对数线性模型优势比的解释 500
15.7 对列联表构建的模型进行拟合
优度检验* 502
卡方拟合优度统计量 502
标准化残差 503
对数线性模型的拟合优度 504
通过比较G2值来比较模型 504
逻辑斯蒂模型和对数线性模型
之间的联系 505
逻辑斯蒂模型和对数线性模型
之间的区别 505
15.8 本章概要 506
思考题 506
第16章 高级统计方法概述 515
16.1 纵向数据分析* 515
MANOVA:多因变量方差分析 515
带有随机效应的混合效应模型 516
使用随机效应的一维重复测量
方差分析 516
16.2 多层(分层)模型* 518
为两个层上的观测值构建模型 519
16.3 事件历史模型* 520
截尾数据和时变协变量 520
事件的发生率 521
比例风险模型 521
16.4 路径分析* 523
路径图 523
路径系数 524
直接效应和间接效应 525
路径分解 525
对因果模型的一个告诫 527
16.5 因子分析* 527
因子分析模型 528
拟合因子分析模型 528
分类响应变量的潜在分类模型 531
起源和争议 531
16.6 结构方程模型* 532
计量模型 532
结构方程模型 533
协方差结构模型中的特例 533
拟合协方差结构模型 534
检验模型拟合 535
16.7 马尔可夫链* 535
转移概率 536
思考题 537
附录A SPSS和SAS统计分析 539
附录B 奇数练习答案 558
附录C 统计检验临界值表 576
参考文献 582