ChatGPT简明教程
¥49.00定价
作者: 焦李成
出版时间:2023-07
出版社:西安电子科技大学出版社
- 西安电子科技大学出版社
- 9787560669359
- 1-1
- 514042
- 49242208-4
- 平装
- 短16开
- 2023-07
- 274
- 224
- TP18
- 自动化技术、计算机技术
- 本科 高职
内容简介
作为通用人工智能的重要进展,ChatGPT的出现引起了学术界和产业界人士的广泛关注。本书系统地论述了ChatGPT的发展历程、核心技术和基本原理等内容。全书共15章。第1章介绍了ChatGPT的前世今生;第2~6章论述了ChatGPT相关的基础理论与发展应用;第7~10章论述了ChatGPT的核心技术,包括Transformer、基于人类反馈的强化学习、提示学习以及模型学习与优化;第11章和第12章论述了ChatGPT的重要应用场景;第13~15章论述了以ChatGPT为代表的通用大模型范式面临的挑战和对各行业领域的影响,并对下一代人工智能重大场景战略进行了解读。
本书内容新颖,通俗易懂,适合作为人工智能、智能科学与技术、计算机科学与技术、智能机器人技术、控制科学与工程、物联网工程等专业本科生及研究生的通识教材,也可供相关科研人员、政府工作人员参考学习。
本书内容新颖,通俗易懂,适合作为人工智能、智能科学与技术、计算机科学与技术、智能机器人技术、控制科学与工程、物联网工程等专业本科生及研究生的通识教材,也可供相关科研人员、政府工作人员参考学习。
目录
第1章 ChatGPT的前世今生1
1.1 什么是 ChatGPT 1
1.2 从波士顿动力机器人到ChatGPT 5
1.3 ChatGPT的使用说明 6
1.3.1 ChatGPT的注册 7
1.3.2 ChatGPT的使用 7
1.3.3 如何与ChatGPT交流 8
1.4 ChatGPT 的优势与缺点 13
1.4.1 ChatGPT的优势 13
1.4.2 ChatGPT的缺点 13
1.5 ChatGPT的应用场景 14
1.5.1 办公领域 15
1.5.2 搜索引擎 15
1.5.3 教育领域 16
1.5.4 会计领域 17
1.5.5 其他领域 17
第2章 自然语言处理18
2.1 语义理解 19
2.2 机器翻译 20
2.3 自动问答 21
2.3.1 自动问答系统的基础架构 21
2.3.2 自动问答系统的实现技术 22
2.3.3 自动问答技术面临的挑战和发展趋势 22
2.4 文本生成 23
2.4.1 基于规则驱动的文本生成 23
2.4.2 基于机器学习的文本生成 23
2.5 情感分析 24
第3章 ChatGPT深度学习基础理论27
3.1 神经网络的基本原理 28
3.2 卷积神经网络 29
3.3 Word2Vec 31
3.3.1 连续词袋模型 33
3.3.2 SkipGram模型 33
3.4 循环神经网络 35
3.5 长短期记忆网络 36
第4章 GPT系列大模型38
4.1 大规模预训练模型 38
4.1.1 发展历程 40
4.1.2 大模型的优势 41
4.1.3 应用场景 42
4.2 大型预训练语言模型 43
4.3 GPT1 45
4.3.1 GPT1的结构 46
4.3.2 GPT1的数据集及参数量 47
4.3.3 GPT1的预训练 47
4.3.4 GPT1的微调 47
4.3.5 GPT1的优势及局限性 48
4.4 BERT 48
4.4.1 BERT的结构 49
4.4.2 BERT的数据集及参数量 50
4.4.3 BERT的预训练 51
4.4.4 BERT的微调 51
4.4.5 BERT的优势及局限性 53
4.5 GPT2 53
4.6 GPT3 54
4.7 ChatGPT 56
4.8 GPT4 57
4.8.1 GPT4的基本信息 58
4.8.2 GPT4的亮点 59
第5章 人工智能基础大模型61
5.1 谷歌的ViT22B视觉大模型 61
5.2 Meta的Segment Anything Model(SAM)分割大模型 65
5.3 微软的VisualGPT模型 72
5.4 华为的盘古大模型 75
5.5 阿里的“通义千问”大模型 76
5.6 百度的“文心一言”大模型 77
5.7 商汤的“日日新SenseNova”大模型 79
5.8 西电的“西电遥感脑”大模型 83
5.9 西电的“智瞳医行”大模型 86
第6章 扩散深度网络模型89
6.1 简介与背景 89
6.2 扩散模型的基本原理 89
6.3 扩散模型的改进方法 91
6.3.1 改进的扩散模型 91
6.3.2 更大规模的扩散模型 91
6.3.3 用文本引导的扩散模型 92
6.3.4 DALL·E 2 93
6.3.5 更稳定的扩散模型 94
第7章 ChatGPT核心技术——Transformer95
7.1 整体结构 95
7.2 编码器 96
7.3 解码器 98
7.4 嵌入 99
7.5 模型优缺点 100
第8章 ChatGPT核心技术——基于人类反馈的强化学习101
8.1 强化学习 101
8.1.1 基本定义 101
8.1.2 强化学习的分类 102
8.2 近端策略优化 104
8.2.1 策略梯度 104
8.2.2 信赖域策略优化算法 106
8.2.3 PPO算法 109
8.3 基于人类反馈的强化学习 112
8.4 强化学习Transformer 114
第9章 ChatGPT核心技术——提示学习116
9.1 提示学习的基本流程 116
9.2 提示学习主要构造 118
9.2.1 预训练模型的选择 118
9.2.2 提示工程 118
9.2.3 答案工程 121
9.3 提示学习示例 122
9.3.1 ZeroShot提示学习 122
9.3.2 FewShot提示学习 123
9.3.3 CoT提示学习 124
9.3.4 自一致性提示学习 125
第10章 ChatGPT核心技术——模型学习与优化129
10.1 有监督学习 129
10.2 无监督学习 133
10.3 少样本学习与多任务学习 135
10.4 迁移学习 137
10.5 深度学习优化方法 139
10.5.1 梯度下降算法 139
10.5.2 动量法 140
10.5.3 牛顿法 142
10.5.4 启发式学习优化算法 142
第11章 ChatGPT的主要应用实例144
11.1 让 ChatGPT 成为我们生活中的帮手 144
11.1.1 写文章 144
11.1.2 机器翻译 146
11.1.3 对话聊天与提问 148
11.2 让 ChatGPT 成为我们工作中的顾问 150
11.2.1 关键信息提取 151
11.2.2 检查语法 152
11.2.3 SQL语言生成 153
11.3 让ChatGPT成为我们科研中的助理 154
11.3.1 提供文献检索 155
11.3.2 提供研究背景 155
11.3.3 写代码 157
11.3.4 证明 158
11.4 让ChatGPT为我们提供创作灵感 159
11.4.1 作曲 159
11.4.2 作词 160
11.4.3 绘画 160
第12章 ChatGPT智能教育大模型162
12.1 教育大模型介绍 162
12.2 教育大模型的原理 163
12.3 教育大模型的应用 164
12.4 教育大模型的优势和落地案例 166
12.4.1 教育大模型的优势 166
12.4.2 教育大模型的落地案例 167
第13章 通用大模型范式面临的挑战174
13.1 通用大模型范式面临的十大挑战 174
13.2 ChatGPT挑战问题实例 175
13.2.1 图灵测试 175
13.2.2 基础数学计算 176
13.2.3 语义创新 177
13.2.4 模型偏见 178
13.2.5 语音识别难题 178
13.2.6 环境感知 179
13.3 NLP技术挑战 179
13.4 NLP大模型应用发展挑战 180
13.5 风险与应对战略 181
13.5.1 技术风险及其应对策略 181
13.5.2 社会风险及其应对策略 182
13.5.3 经济风险及其应对策略 183
第14章 ChatGPT对社会变革与产业发展的影响184
14.1 社会变革 184
14.2 教育发展 185
14.3 商业模式 189
14.4 企业优化 191
14.5 产业升级 192
14.6 就业推动 193
第15章 下一代人工智能重大场景战略与解读195
15.1 关于发布《可解释、可通用的下一代人工智能方法》
重大研究计划2023年度项目指南的通告 195
15.2 工业和信息化部等十七部门关于
印发《 “机器人+”应用行动实施方案》的通知 196
15.3 科技部等六部门关于印发《关于加快场景创新以人工智能
高水平应用促进经济高质量发展的
指导意见》的通知 197
15.4 关于支持建设新一代人工智能示范应用场景的通知 197
15.5 国家人工智能创新应用先导区 198
15.6 人工智能教育培养体系 200
15.7 人工智能新基建 201
15.8 人工智能领域伦理治理 202
参考文献204
1.1 什么是 ChatGPT 1
1.2 从波士顿动力机器人到ChatGPT 5
1.3 ChatGPT的使用说明 6
1.3.1 ChatGPT的注册 7
1.3.2 ChatGPT的使用 7
1.3.3 如何与ChatGPT交流 8
1.4 ChatGPT 的优势与缺点 13
1.4.1 ChatGPT的优势 13
1.4.2 ChatGPT的缺点 13
1.5 ChatGPT的应用场景 14
1.5.1 办公领域 15
1.5.2 搜索引擎 15
1.5.3 教育领域 16
1.5.4 会计领域 17
1.5.5 其他领域 17
第2章 自然语言处理18
2.1 语义理解 19
2.2 机器翻译 20
2.3 自动问答 21
2.3.1 自动问答系统的基础架构 21
2.3.2 自动问答系统的实现技术 22
2.3.3 自动问答技术面临的挑战和发展趋势 22
2.4 文本生成 23
2.4.1 基于规则驱动的文本生成 23
2.4.2 基于机器学习的文本生成 23
2.5 情感分析 24
第3章 ChatGPT深度学习基础理论27
3.1 神经网络的基本原理 28
3.2 卷积神经网络 29
3.3 Word2Vec 31
3.3.1 连续词袋模型 33
3.3.2 SkipGram模型 33
3.4 循环神经网络 35
3.5 长短期记忆网络 36
第4章 GPT系列大模型38
4.1 大规模预训练模型 38
4.1.1 发展历程 40
4.1.2 大模型的优势 41
4.1.3 应用场景 42
4.2 大型预训练语言模型 43
4.3 GPT1 45
4.3.1 GPT1的结构 46
4.3.2 GPT1的数据集及参数量 47
4.3.3 GPT1的预训练 47
4.3.4 GPT1的微调 47
4.3.5 GPT1的优势及局限性 48
4.4 BERT 48
4.4.1 BERT的结构 49
4.4.2 BERT的数据集及参数量 50
4.4.3 BERT的预训练 51
4.4.4 BERT的微调 51
4.4.5 BERT的优势及局限性 53
4.5 GPT2 53
4.6 GPT3 54
4.7 ChatGPT 56
4.8 GPT4 57
4.8.1 GPT4的基本信息 58
4.8.2 GPT4的亮点 59
第5章 人工智能基础大模型61
5.1 谷歌的ViT22B视觉大模型 61
5.2 Meta的Segment Anything Model(SAM)分割大模型 65
5.3 微软的VisualGPT模型 72
5.4 华为的盘古大模型 75
5.5 阿里的“通义千问”大模型 76
5.6 百度的“文心一言”大模型 77
5.7 商汤的“日日新SenseNova”大模型 79
5.8 西电的“西电遥感脑”大模型 83
5.9 西电的“智瞳医行”大模型 86
第6章 扩散深度网络模型89
6.1 简介与背景 89
6.2 扩散模型的基本原理 89
6.3 扩散模型的改进方法 91
6.3.1 改进的扩散模型 91
6.3.2 更大规模的扩散模型 91
6.3.3 用文本引导的扩散模型 92
6.3.4 DALL·E 2 93
6.3.5 更稳定的扩散模型 94
第7章 ChatGPT核心技术——Transformer95
7.1 整体结构 95
7.2 编码器 96
7.3 解码器 98
7.4 嵌入 99
7.5 模型优缺点 100
第8章 ChatGPT核心技术——基于人类反馈的强化学习101
8.1 强化学习 101
8.1.1 基本定义 101
8.1.2 强化学习的分类 102
8.2 近端策略优化 104
8.2.1 策略梯度 104
8.2.2 信赖域策略优化算法 106
8.2.3 PPO算法 109
8.3 基于人类反馈的强化学习 112
8.4 强化学习Transformer 114
第9章 ChatGPT核心技术——提示学习116
9.1 提示学习的基本流程 116
9.2 提示学习主要构造 118
9.2.1 预训练模型的选择 118
9.2.2 提示工程 118
9.2.3 答案工程 121
9.3 提示学习示例 122
9.3.1 ZeroShot提示学习 122
9.3.2 FewShot提示学习 123
9.3.3 CoT提示学习 124
9.3.4 自一致性提示学习 125
第10章 ChatGPT核心技术——模型学习与优化129
10.1 有监督学习 129
10.2 无监督学习 133
10.3 少样本学习与多任务学习 135
10.4 迁移学习 137
10.5 深度学习优化方法 139
10.5.1 梯度下降算法 139
10.5.2 动量法 140
10.5.3 牛顿法 142
10.5.4 启发式学习优化算法 142
第11章 ChatGPT的主要应用实例144
11.1 让 ChatGPT 成为我们生活中的帮手 144
11.1.1 写文章 144
11.1.2 机器翻译 146
11.1.3 对话聊天与提问 148
11.2 让 ChatGPT 成为我们工作中的顾问 150
11.2.1 关键信息提取 151
11.2.2 检查语法 152
11.2.3 SQL语言生成 153
11.3 让ChatGPT成为我们科研中的助理 154
11.3.1 提供文献检索 155
11.3.2 提供研究背景 155
11.3.3 写代码 157
11.3.4 证明 158
11.4 让ChatGPT为我们提供创作灵感 159
11.4.1 作曲 159
11.4.2 作词 160
11.4.3 绘画 160
第12章 ChatGPT智能教育大模型162
12.1 教育大模型介绍 162
12.2 教育大模型的原理 163
12.3 教育大模型的应用 164
12.4 教育大模型的优势和落地案例 166
12.4.1 教育大模型的优势 166
12.4.2 教育大模型的落地案例 167
第13章 通用大模型范式面临的挑战174
13.1 通用大模型范式面临的十大挑战 174
13.2 ChatGPT挑战问题实例 175
13.2.1 图灵测试 175
13.2.2 基础数学计算 176
13.2.3 语义创新 177
13.2.4 模型偏见 178
13.2.5 语音识别难题 178
13.2.6 环境感知 179
13.3 NLP技术挑战 179
13.4 NLP大模型应用发展挑战 180
13.5 风险与应对战略 181
13.5.1 技术风险及其应对策略 181
13.5.2 社会风险及其应对策略 182
13.5.3 经济风险及其应对策略 183
第14章 ChatGPT对社会变革与产业发展的影响184
14.1 社会变革 184
14.2 教育发展 185
14.3 商业模式 189
14.4 企业优化 191
14.5 产业升级 192
14.6 就业推动 193
第15章 下一代人工智能重大场景战略与解读195
15.1 关于发布《可解释、可通用的下一代人工智能方法》
重大研究计划2023年度项目指南的通告 195
15.2 工业和信息化部等十七部门关于
印发《 “机器人+”应用行动实施方案》的通知 196
15.3 科技部等六部门关于印发《关于加快场景创新以人工智能
高水平应用促进经济高质量发展的
指导意见》的通知 197
15.4 关于支持建设新一代人工智能示范应用场景的通知 197
15.5 国家人工智能创新应用先导区 198
15.6 人工智能教育培养体系 200
15.7 人工智能新基建 201
15.8 人工智能领域伦理治理 202
参考文献204