- 电子工业出版社
- 9787121517686
- 1-1
- 568495
- 平塑
- 16开
- 2025-11
- 662
- 384
- 医学
- 公共卫生与预防医学类
- 医学类
- 本科 研究生及以上
内容简介
本书是一本关于如何应用R语言开展流行病学数据清洗、整理和分析的医学教材。全书共18章,首先介绍了R语言基础知识,包括R语言简介、数据管理、控制流、文本处理、数据可视化、基本统计分析方法;然后介绍了R语言在常见流行病学研究设计中的应用,包括现况研究、生态学研究、队列研究、病例对照研究、随机对照试验、筛检试验和诊断试验;最后介绍了R语言在其他流行病学问题中的应用,包括缺失值处理、功效分析、交互作用分析、因果推断、Meta分析、孟德尔随机化。本书通过概述、示例实践、练习案例等教学模块,全面介绍和演示了流行病学数据的R语言处理过程。通过学习本书,学生能更好地理解流行病学研究,为开展后续的数据分析打下基础。本书有助于学生利用R语言解决实际问题,以更好地开展流行病学的相关研究。 本书可以作为流行病学相关专业的高年级本科生、研究生教材,同时对从事数据分析的医务人员、专业技术人员等也具有参考价值。
目录
第1章 R语言简介 1
1.1 概述 1
1.1.1 R语言是什么 1
1.1.2 为什么选择R语言 2
1.2 前期准备 2
1.2.1 下载并安装R语言 2
1.2.2 下载并安装RStudio 3
1.3 使用RStudio:极简入门 4
1.3.1 RStudio界面导览 4
1.3.2 创建R语言项目 4
1.3.3 创建R语言脚本 5
1.4 程序包的管理 5
1.4.1 安装程序包 5
1.4.2 加载程序包 6
1.4.3 卸载与删除程序包 6
1.4.4 其他实用函数 7
1.4.5 安装程序包的常见问题与解决方案 7
1.5 更新R-base、程序包和RStudio 8
1.5.1 更新R-base和程序包 8
1.5.2 更新RStudio 10
1.6 获取帮助 10
1.6.1 查看说明文档 10
1.6.2 在社区中查找解决方案或提问 11
1.7 练习案例 12
1.8 小结 13
第2章 数据管理 14
2.1 数据类型 14
2.1.1 基本数据类型速览 14
2.1.2 向量 15
2.1.3 因子 15
2.1.4 矩阵 16
2.1.5 数据框 16
2.1.6 数组 18
2.1.7 列表 18
2.1.8 数据类型的层次结构 19
2.2 数据的输入和输出 19
2.2.1 数据的输入 19
2.2.2 数据的输出 21
2.3 函数 21
2.3.1 概念 21
2.3.2 数据管理常用函数 22
2.3.3 函数查询 24
2.4 创建新变量 25
2.4.1 变量命名规则和赋值方式 25
2.4.2 常用的运算符 25
2.4.3 data.table程序包 26
2.5 变量重编码 27
2.6 变量重命名 28
2.7 数据类型的查看和转换 29
2.7.1 查看数据类型 29
2.7.2 数据类型的转换 30
2.8 数据排序 31
2.8.1 sort 31
2.8.2 rank 32
2.8.3 order 32
2.8.4 setorder 33
2.9 数据集取子集 33
2.9.1 基于变量提取、删除子集 33
2.9.2 基于条件提取子集 34
2.9.3 保留非重复行 35
2.9.4 删除存在缺失值的行 35
2.10 数据集合并 36
2.10.1 简单合并 36
2.10.2 匹配合并 37
2.11 数据整合与重构 38
2.11.1 转置 38
2.11.2 分类汇总 39
2.11.3 融合 39
2.11.4 重铸 40
2.12 练习案例 40
2.13 小结 41
第3章 控制流 44
3.1 条件执行 44
3.1.1 if-else结构 44
3.1.2 ifelse 45
3.1.3 switch 45
3.2 循环 46
3.2.1 for循环 46
3.2.2 while循环 47
3.2.3 repeat循环 47
3.2.4 循环控制 47
3.3 减少显式循环 48
3.3.1 向量化运算 48
3.3.2 apply族函数 50
3.3.3 dplyr程序包中的向量化函数 51
3.4 并行计算 52
3.5 练习案例 54
3.6 小结 55
第4章 文本处理 56
4.1 正则表达式 56
4.1.1 显示匹配 56
4.1.2 元字符 57
4.1.3 转义字符 58
4.1.4 字符类 59
4.1.5 量词 61
4.1.6 定位符 61
4.1.7 分组 62
4.1.8 处理选项 63
4.2 字符统计和翻译 64
4.2.1 字符统计函数 64
4.2.2 字符翻译函数 64
4.3 字符串连接 65
4.3.1 base程序包函数 65
4.3.2 stringr程序包函数 65
4.4 字符串拆分 66
4.4.1 base程序包函数 66
4.4.2 stringr程序包函数 66
4.5 字符串查询 67
4.5.1 base程序包函数 67
4.5.2 stringr程序包函数 69
4.6 字符串替换 71
4.6.1 base程序包函数 71
4.6.2 stringr程序包函数 71
4.7 字符串提取 72
4.7.1 base程序包函数 72
4.7.2 stringr程序包函数 74
4.8 字符串定制输出 76
4.8.1 base程序包函数 76
4.8.2 stringr程序包函数 77
4.9 练习案例 78
4.10 小结 78
第5章 数据可视化 81
5.1 背景介绍 81
5.2 ggplot2程序包 81
5.3 数据及图形属性映射 82
5.4 几何对象 83
5.4.1 概述 83
5.4.2 散点图和折线图 84
5.4.3 误差棒图和热图 85
5.5 标度和图例 87
5.5.1 标度 88
5.5.2 图例 90
5.6 坐标系统 91
5.7 图形分组和分面 92
5.7.1 分组 92
5.7.2 分面 94
5.8 主题调整 97
5.9 图形输出 100
5.10 练习案例 101
5.11 小结 101
第6章 基本统计分析方法 103
6.1 统计描述与区间估计 103
6.2 均数比较的假设检验 104
6.2.1 t检验 104
6.2.2 方差分析 105
6.3 率比较的假设检验 109
6.4 非参数假设检验 110
6.5 相关与回归 111
6.5.1 相关 111
6.5.2 回归 112
6.6 广义线性模型 116
6.6.1 Logistic 回归 116
6.6.2 泊松回归 117
6.7 生存分析 118
6.7.1 绘制生存曲线 118
6.7.2 Cox比例风险模型 120
6.8 混合效应模型 121
6.9 练习案例 123
6.10 小结 124
第7章 现况研究 126
7.1 概述 126
7.1.1 概念 126
7.1.2 现况研究常见的偏倚 127
7.1.3 现况研究的主要用途 127
7.1.4 现况研究的优缺点 127
7.2 现况研究类型 127
7.2.1 按调查方式分类 127
7.2.2 按研究目的分类 128
7.3 示例实践 132
7.3.1 抽样调查的样本量计算 132
7.3.2 描述性研究 133
7.3.3 分析性研究 140
7.4 练习案例 149
7.4.1 标准化法 149
7.4.2 关联 149
7.4.3 逻辑回归 149
7.5 小结 150
第8章 生态学研究 151
8.1 研究设计概述 151
8.1.1 概念 151
8.1.2 生态学研究的分类 151
1.1 概述 1
1.1.1 R语言是什么 1
1.1.2 为什么选择R语言 2
1.2 前期准备 2
1.2.1 下载并安装R语言 2
1.2.2 下载并安装RStudio 3
1.3 使用RStudio:极简入门 4
1.3.1 RStudio界面导览 4
1.3.2 创建R语言项目 4
1.3.3 创建R语言脚本 5
1.4 程序包的管理 5
1.4.1 安装程序包 5
1.4.2 加载程序包 6
1.4.3 卸载与删除程序包 6
1.4.4 其他实用函数 7
1.4.5 安装程序包的常见问题与解决方案 7
1.5 更新R-base、程序包和RStudio 8
1.5.1 更新R-base和程序包 8
1.5.2 更新RStudio 10
1.6 获取帮助 10
1.6.1 查看说明文档 10
1.6.2 在社区中查找解决方案或提问 11
1.7 练习案例 12
1.8 小结 13
第2章 数据管理 14
2.1 数据类型 14
2.1.1 基本数据类型速览 14
2.1.2 向量 15
2.1.3 因子 15
2.1.4 矩阵 16
2.1.5 数据框 16
2.1.6 数组 18
2.1.7 列表 18
2.1.8 数据类型的层次结构 19
2.2 数据的输入和输出 19
2.2.1 数据的输入 19
2.2.2 数据的输出 21
2.3 函数 21
2.3.1 概念 21
2.3.2 数据管理常用函数 22
2.3.3 函数查询 24
2.4 创建新变量 25
2.4.1 变量命名规则和赋值方式 25
2.4.2 常用的运算符 25
2.4.3 data.table程序包 26
2.5 变量重编码 27
2.6 变量重命名 28
2.7 数据类型的查看和转换 29
2.7.1 查看数据类型 29
2.7.2 数据类型的转换 30
2.8 数据排序 31
2.8.1 sort 31
2.8.2 rank 32
2.8.3 order 32
2.8.4 setorder 33
2.9 数据集取子集 33
2.9.1 基于变量提取、删除子集 33
2.9.2 基于条件提取子集 34
2.9.3 保留非重复行 35
2.9.4 删除存在缺失值的行 35
2.10 数据集合并 36
2.10.1 简单合并 36
2.10.2 匹配合并 37
2.11 数据整合与重构 38
2.11.1 转置 38
2.11.2 分类汇总 39
2.11.3 融合 39
2.11.4 重铸 40
2.12 练习案例 40
2.13 小结 41
第3章 控制流 44
3.1 条件执行 44
3.1.1 if-else结构 44
3.1.2 ifelse 45
3.1.3 switch 45
3.2 循环 46
3.2.1 for循环 46
3.2.2 while循环 47
3.2.3 repeat循环 47
3.2.4 循环控制 47
3.3 减少显式循环 48
3.3.1 向量化运算 48
3.3.2 apply族函数 50
3.3.3 dplyr程序包中的向量化函数 51
3.4 并行计算 52
3.5 练习案例 54
3.6 小结 55
第4章 文本处理 56
4.1 正则表达式 56
4.1.1 显示匹配 56
4.1.2 元字符 57
4.1.3 转义字符 58
4.1.4 字符类 59
4.1.5 量词 61
4.1.6 定位符 61
4.1.7 分组 62
4.1.8 处理选项 63
4.2 字符统计和翻译 64
4.2.1 字符统计函数 64
4.2.2 字符翻译函数 64
4.3 字符串连接 65
4.3.1 base程序包函数 65
4.3.2 stringr程序包函数 65
4.4 字符串拆分 66
4.4.1 base程序包函数 66
4.4.2 stringr程序包函数 66
4.5 字符串查询 67
4.5.1 base程序包函数 67
4.5.2 stringr程序包函数 69
4.6 字符串替换 71
4.6.1 base程序包函数 71
4.6.2 stringr程序包函数 71
4.7 字符串提取 72
4.7.1 base程序包函数 72
4.7.2 stringr程序包函数 74
4.8 字符串定制输出 76
4.8.1 base程序包函数 76
4.8.2 stringr程序包函数 77
4.9 练习案例 78
4.10 小结 78
第5章 数据可视化 81
5.1 背景介绍 81
5.2 ggplot2程序包 81
5.3 数据及图形属性映射 82
5.4 几何对象 83
5.4.1 概述 83
5.4.2 散点图和折线图 84
5.4.3 误差棒图和热图 85
5.5 标度和图例 87
5.5.1 标度 88
5.5.2 图例 90
5.6 坐标系统 91
5.7 图形分组和分面 92
5.7.1 分组 92
5.7.2 分面 94
5.8 主题调整 97
5.9 图形输出 100
5.10 练习案例 101
5.11 小结 101
第6章 基本统计分析方法 103
6.1 统计描述与区间估计 103
6.2 均数比较的假设检验 104
6.2.1 t检验 104
6.2.2 方差分析 105
6.3 率比较的假设检验 109
6.4 非参数假设检验 110
6.5 相关与回归 111
6.5.1 相关 111
6.5.2 回归 112
6.6 广义线性模型 116
6.6.1 Logistic 回归 116
6.6.2 泊松回归 117
6.7 生存分析 118
6.7.1 绘制生存曲线 118
6.7.2 Cox比例风险模型 120
6.8 混合效应模型 121
6.9 练习案例 123
6.10 小结 124
第7章 现况研究 126
7.1 概述 126
7.1.1 概念 126
7.1.2 现况研究常见的偏倚 127
7.1.3 现况研究的主要用途 127
7.1.4 现况研究的优缺点 127
7.2 现况研究类型 127
7.2.1 按调查方式分类 127
7.2.2 按研究目的分类 128
7.3 示例实践 132
7.3.1 抽样调查的样本量计算 132
7.3.2 描述性研究 133
7.3.3 分析性研究 140
7.4 练习案例 149
7.4.1 标准化法 149
7.4.2 关联 149
7.4.3 逻辑回归 149
7.5 小结 150
第8章 生态学研究 151
8.1 研究设计概述 151
8.1.1 概念 151
8.1.2 生态学研究的分类 151












