新一代人工智能:从深度学习到大模型
¥89.00定价
作者: 张重生
出版时间:2025-02-24
出版社:机械工业出版社
- 机械工业出版社
- 9787111770022
- 1-2
- 547479
- 平装
- 2025-02-24
- 385
内容简介
本书注重对新一代人工智能相关理论和技术进行深入的原理讲解,共计19 章,囊括了深度学习的基础理论、深度学习的优化问题、各种卷积操作、损失函数、经典的卷积神经网络结构、目标识别和度量学习算法、深度学习目标检测技术、图像分割算法、生成对抗网络、蒸馏学习、长尾学习技术、图像增广技术,以及大模型相关的Transformer技术、预训练技术、大语言模型、视觉-语言模型及视觉大模型等技术。
本书既可作为高等学校人工智能、智能科学与技术、计算机科学与技术、数据科学与大数据技术等专业的教材,也可作为人工智能领域的科研人员、业界人士、高校教师和爱好者的参考书,以系统掌握新一代人工智能的相关理论和技术。
本书既可作为高等学校人工智能、智能科学与技术、计算机科学与技术、数据科学与大数据技术等专业的教材,也可作为人工智能领域的科研人员、业界人士、高校教师和爱好者的参考书,以系统掌握新一代人工智能的相关理论和技术。
目录
第1章 绪论1
1.1 人工智能的概念及其发展现状1
1.2 人工智能的主要发展历程4
1.3 深度学习/新一代人工智能的研究与应用领域5
1.4 结束语11
本章参考文献12
第2章 数据思维13
2.1 新一代人工智能时代数据的重要性13
2.2 数据思维中的常见错误与陷阱15
2.3 深度学习/新一代人工智能研究的16个经典数据集介绍17
2.4 结束语38
第3章 人工神经网络40
3.1 人工神经网络的前向计算40
3.2 人工神经网络的误差反向传播原理43
3.3 人工神经网络实现47
第4章 卷积神经网络50
4.1 卷积神经网络原理51
4.2 经典的卷积神经网络介绍56
4.3 卷积神经网络的误差反向传播原理61
第5章 常见卷积操作与经典卷积神经网络73
5.1 常见的卷积操作介绍73
5.2 经典的卷积神经网络介绍84
第6章 神经网络优化88
6.1 激活函数88
6.2 权值初始化93
6.3 神经网络的神经元值归一化与权值归一化95
6.4 神经网络的正则化100
6.5 梯度更新策略与超参优化101
本章参考文献104
第7章 孪生神经网络107
7.1 孪生神经网络介绍107
7.2 孪生神经网络结构108
7.3 孪生神经网络实现109
7.4 Triplet Loss/FaceNet算法111
7.5 SiamFC目标追踪算法113
第8章 蒸馏网络118
8.1 蒸馏网络介绍118
8.2 带温度的Softmax激活函数119
8.3 蒸馏网络结构120
8.4 蒸馏学习过程121
8.5 总结122
本章参考文献123
第9章 损失函数124
9.1 损失函数简介124
9.1.3 损失函数的分类体系125
9.2 十种常见的损失函数126
9.3 最新损失函数136
9.4 KL散度与JS散度142
本章参考文献143
第10章 深度学习常用的图像增广技术144
10.1 图像增广概述144
10.2 简单的图像变换技术145
10.3 RandAugment图像增广技术 146
10.4 MixUp图像合成技术147
10.5 CutMix图像合成技术148
10.6 AugMix图像合成技术149
第11章 YOLO系列目标检测算法153
11.1 深度学习目标检测综述153
11.2 YOLO目标检测算法原理155
11.3 YOLO系列目标检测算法的发展历程166
第12章 Faster R-CNN系列目标检测算法168
12.1 R-CNN目标检测算法168
12.2 Fast R-CNN目标检测算法169
12.3 Faster R-CNN目标检测算法172
12.4 Mask R-CNN目标检测/图像分割算法182
第13章 基于深度学习的图像分割技术190
13.1 全卷积网络190
13.2 U-Net200
13.3 DeepLabs等前沿分割算法205
第14章 生成对抗网络(GAN)210
14.1 原始GAN/朴素GAN211
14.2 DCGAN219
14.3 BEGAN223
14.4 基于GAN的关系型/表格型数据生成技术227
本章参考文献230
第15章 长尾学习231
15.1 长尾分布和长尾学习背景介绍231
15.2 代表性长尾学习算法236
第16章 Transformer架构原理244
16.1 自注意力机制244
16.2 Transformer架构251
16.3 Transformer的基础应用——BERT自然语言处理模型257
本章参考文献258
第17章 大语言模型259
17.1 大模型发展现状及其影响和意义259
17.2 大模型的核心技术261
17.3 大模型的应用方法262
第18章 视觉Transformer模型265
18.1 视觉Transformer架构ViT265
18.2 Swin Transformer架构266
第19章 语言-视觉预训练模型和视觉大模型271
19.1 语言-视觉预训练模型——CLIP272
19.2 视觉预训练技术(MAE)275
19.3 DINO v2视觉大模型277
1.1 人工智能的概念及其发展现状1
1.2 人工智能的主要发展历程4
1.3 深度学习/新一代人工智能的研究与应用领域5
1.4 结束语11
本章参考文献12
第2章 数据思维13
2.1 新一代人工智能时代数据的重要性13
2.2 数据思维中的常见错误与陷阱15
2.3 深度学习/新一代人工智能研究的16个经典数据集介绍17
2.4 结束语38
第3章 人工神经网络40
3.1 人工神经网络的前向计算40
3.2 人工神经网络的误差反向传播原理43
3.3 人工神经网络实现47
第4章 卷积神经网络50
4.1 卷积神经网络原理51
4.2 经典的卷积神经网络介绍56
4.3 卷积神经网络的误差反向传播原理61
第5章 常见卷积操作与经典卷积神经网络73
5.1 常见的卷积操作介绍73
5.2 经典的卷积神经网络介绍84
第6章 神经网络优化88
6.1 激活函数88
6.2 权值初始化93
6.3 神经网络的神经元值归一化与权值归一化95
6.4 神经网络的正则化100
6.5 梯度更新策略与超参优化101
本章参考文献104
第7章 孪生神经网络107
7.1 孪生神经网络介绍107
7.2 孪生神经网络结构108
7.3 孪生神经网络实现109
7.4 Triplet Loss/FaceNet算法111
7.5 SiamFC目标追踪算法113
第8章 蒸馏网络118
8.1 蒸馏网络介绍118
8.2 带温度的Softmax激活函数119
8.3 蒸馏网络结构120
8.4 蒸馏学习过程121
8.5 总结122
本章参考文献123
第9章 损失函数124
9.1 损失函数简介124
9.1.3 损失函数的分类体系125
9.2 十种常见的损失函数126
9.3 最新损失函数136
9.4 KL散度与JS散度142
本章参考文献143
第10章 深度学习常用的图像增广技术144
10.1 图像增广概述144
10.2 简单的图像变换技术145
10.3 RandAugment图像增广技术 146
10.4 MixUp图像合成技术147
10.5 CutMix图像合成技术148
10.6 AugMix图像合成技术149
第11章 YOLO系列目标检测算法153
11.1 深度学习目标检测综述153
11.2 YOLO目标检测算法原理155
11.3 YOLO系列目标检测算法的发展历程166
第12章 Faster R-CNN系列目标检测算法168
12.1 R-CNN目标检测算法168
12.2 Fast R-CNN目标检测算法169
12.3 Faster R-CNN目标检测算法172
12.4 Mask R-CNN目标检测/图像分割算法182
第13章 基于深度学习的图像分割技术190
13.1 全卷积网络190
13.2 U-Net200
13.3 DeepLabs等前沿分割算法205
第14章 生成对抗网络(GAN)210
14.1 原始GAN/朴素GAN211
14.2 DCGAN219
14.3 BEGAN223
14.4 基于GAN的关系型/表格型数据生成技术227
本章参考文献230
第15章 长尾学习231
15.1 长尾分布和长尾学习背景介绍231
15.2 代表性长尾学习算法236
第16章 Transformer架构原理244
16.1 自注意力机制244
16.2 Transformer架构251
16.3 Transformer的基础应用——BERT自然语言处理模型257
本章参考文献258
第17章 大语言模型259
17.1 大模型发展现状及其影响和意义259
17.2 大模型的核心技术261
17.3 大模型的应用方法262
第18章 视觉Transformer模型265
18.1 视觉Transformer架构ViT265
18.2 Swin Transformer架构266
第19章 语言-视觉预训练模型和视觉大模型271
19.1 语言-视觉预训练模型——CLIP272
19.2 视觉预训练技术(MAE)275
19.3 DINO v2视觉大模型277