深度学习及应用 / 一流本科专业一流本科课程建设系列教材,新工科·普通高等教育机电类系列教材
定价:¥49.80
作者: 徐国艳
出版时间:2025-09-04
出版社:机械工业出版社
- 机械工业出版社
- 9787111789864
- 1-1
- 561702
- 平装
- 2025-09-04
- 378
内容简介
本书内容涵盖深度学习的基础理论及前沿技术,内容循序渐进,旨在逐步提升学习者对深度学习技术的理解和应用能力。本书共10章,主要内容包括绪论、深度学习基础理论及实践、卷积神经网络理论及实践、基于CNN的目标检测算法及实践、基于CNN的图像分割算法及实践、循环神经网络理论及实践、注意力机制与Transformer、生成式网络及实践、强化学习理论及实践、大模型技术及实践等。本书紧密结合产教融合与科教融汇的理念,将机械、医工、自动驾驶等领域的产业级工程项目和科研成果转化为教学实践项目,确保理论知识与实际应用的无缝对接。
本书可作为工科类专业研究生的教材,也可作为工科类专业高年级本科生的教材,还可作为有志于掌握深度学习知识的学习者的参考读物。本书配有项目代码讲解视频、部分习题参考答案,读者可扫描书中的二维码进行观看;本书提供了部分教学案例和实践项目的源代码,读者可打开书中所附链接运行或扫描内封上的二维码进行下载。本书还配有PPT课件、教学大纲等,免费赠送给采用本书作为教材的教师(可登录www.cmpedu.com注册下载)。首次使用二维码的方法请见封底有关说明。
本书可作为工科类专业研究生的教材,也可作为工科类专业高年级本科生的教材,还可作为有志于掌握深度学习知识的学习者的参考读物。本书配有项目代码讲解视频、部分习题参考答案,读者可扫描书中的二维码进行观看;本书提供了部分教学案例和实践项目的源代码,读者可打开书中所附链接运行或扫描内封上的二维码进行下载。本书还配有PPT课件、教学大纲等,免费赠送给采用本书作为教材的教师(可登录www.cmpedu.com注册下载)。首次使用二维码的方法请见封底有关说明。
目录
前言
第1章绪论1
11人工智能技术及其发展1
12深度学习的特点及进展3
13深度学习的框架与平台7
131国外深度学习框架与平台7
132国内深度学习框架与平台8
习题9
第2章深度学习基础理论及实践11
21神经网络简介11
211神经网络基本概念11
212单层感知机11
213多层感知机14
22深度学习数学理论15
221信号前向传播16
222激活函数17
223损失函数19
224参数优化方法20
225误差反向传播22
226计算图28
23全连接神经网络实践项目30
231基于MLP的车牌识别32
232基于MLP的机械零件分类识别34
233基于MLP的自动驾驶数据集分类识别35
234基于MLP加速生物医学成像中的图像重建35
习题36
第3章卷积神经网络理论及实践38
31卷积神经网络理论基础38
311卷积神经网络的基本结构与特点38
312卷积层41
313池化层44
32典型的卷积神经网络模型46
321LeNet46
322AlexNet47
323VGGNet49
324GoogLeNet51
325ResNet55
33卷积神经网络实践项目57
331基于CNN的斑马线检测57
332基于多个典型CNN的眼疾数据集分类识别58
333基于飞桨高层API的交通图像分类识别58
334基于残差网络的自动驾驶数据集分类识别59
335基于残差网络的机械零件分类59
习题60
第4章基于CNN的目标检测算法及实践61
41目标检测概述61
411目标检测的基本介绍61
412目标检测算法的发展62
413数据格式与评估指标64
42两阶段目标检测算法66
421RCNN66
422SPPNet和Fast RCNN68
423Faster RCNN70
424进阶的两阶段目标检测算法72
43单阶段目标检测算法73
431YOLO系列73
432SSD80
433RetinaNet82
44Anchor Free目标检测算法83
441CornerNet83
442FCOS和CenterNet85
45目标检测实践项目86
451基于PaddleHub预训练模型的车辆目标检测86
452基于YOLOv3的自动驾驶数据集目标检测87
453基于YOLOv5的机械零件数据集目标检测88
习题89
第5章基于CNN的图像分割算法及实践91
51图像分割概述91
511图像分割的分类91
512图像分割算法的发展91
513数据格式与评估指标94
52全卷积神经网络95
521上采样方法96
522特征融合98
523FCN总结99
53UNet/SegNet99
531UNet99
532SegNet100
54DeepLab系列101
541DeepLab V1/V2102
542DeepLab V3/V3+105
55图像分割实践项目109
551基于PaddleHub预训练模型的人像分割109
552基于DeepLab V3+的自动驾驶数据集图像分割110
553基于PaddleX的医学影像视盘分割110
554基于DeepLab V3+的机械零件数据集图像分割112
习题112
第6章循环神经网络理论及实践114
61自然语言处理及其相关技术114
611自然语言处理的发展历程114
612词向量技术115
62循环神经网络117
63长短期记忆网络和门控循环单元118
631长短期记忆网络118
632门控循环单元121
64深度循环神经网络122
641堆叠循环神经网络123
642深度双向循环神经网络123
65序列到序列模型125
66循环神经网络实践项目127
661使用Gensim库进行词向量
生成127
662基于LSTM的文本情感分析128
663基于循环神经网络(GRU/LSTM)
的车辆轨迹预测128
习题129
第7章注意力机制与Transformer131
71从RNN到Transformer的演进131
711循环架构的链式衰减问题131
712时序依赖与并行计算的博弈132
713编码器解码器架构的演进132
714Transformer的里程碑意义134
72注意力机制基础134
721注意力机制的核心思想134
722传统注意力机制135
723自注意力机制136
73Transformer模型架构137
731Transformer整体架构概述137
732编码器138
733解码器141
734位置编码142
735Transformer的输入和输出143
74Transformer模型训练144
75Vision Transformer模型145
751Vision Transformer简介145
752Vision Transformer的整体结构146
76实践项目149
761Transformer注意力机制及其扩展技术实现149
762基于Transformer的文本情感分析149
763基于ViT的车辆图片分类149
764基于ViT的医学数字病理图像制片缺陷分类150
习题152
第8章生成式网络及实践154
81生成式网络概述154
82变分自编码器155
83生成对抗网络155
831生成对抗网络机理155
832生成对抗网络变体架构159
84生成扩散模型162
85基于Transformer的生成模型163
86生成式网络实践项目164
861基于生成式网络的手写数字图片生成164
862基于生成式网络的城市驾驶场景数据生成164
863基于变分自编码器的图像生成166
864基于扩散模型的车辆图像生成167
习题167
第9章强化学习理论及实践169
91强化学习概述169
911强化学习简介169
912强化学习分类170
92强化学习基础理论171
921马尔可夫决策过程171
922强化学习算法原理172
93表格型强化学习方法174
931Qlearning174
932SARSA176
94值函数强化学习方法178
941DQN178
942DDQN180
943DRQN181
95策略梯度强化学习方法182
951策略梯度计算182
952演员评论家算法183
953近端策略优化算法185
954深度确定性策略梯度算法188
955双延迟深度确定性策略梯度算法189
956SAC191
96强化学习实践项目194
961基于Qlearning的智能体配送路径规划194
962基于DQN的智能体配送路径规划194
963基于PPO小车爬坡195
习题196
第10章大模型技术及实践198
101大模型技术概述198
1011大模型的定义和分类198
1012大模型技术研究进展概述200
1013大模型发展中的伦理考量202
102大模型生成技术原理203
1021自回归生成机制203
1022检索增强生成204
1023知识处理技术206
103大模型部署优化技术207
1031模型压缩207
1032稀疏架构208
1033部署框架209
104大模型提示词工程211
105大模型训练213
106MCP模型上下文协议215
107大模型智能体218
1071LLM Agent定义与能力218
1072LLM Agent的类型与能力划分218
1073智能体系统的构建流程与运行机制218
1074典型智能体框架与工具生态219
108大模型实践项目220
1081大模型调用基础——文本与图像的生成方法220
1082文心大模型ERNIE45VL多模态应用实践221
1083文心大模型ERNIE45监督微调文本生成实践221
1084基于计算机视觉和大语言模型的智能停车场管理系统221
1085基于DeepSeek检索增强的智能问答系统222
1086基于LangChain自动驾驶决策智能体构建223
1087基于大视觉语言模型的汽车驾驶场景描述226
习题234
参考文献236
第1章绪论1
11人工智能技术及其发展1
12深度学习的特点及进展3
13深度学习的框架与平台7
131国外深度学习框架与平台7
132国内深度学习框架与平台8
习题9
第2章深度学习基础理论及实践11
21神经网络简介11
211神经网络基本概念11
212单层感知机11
213多层感知机14
22深度学习数学理论15
221信号前向传播16
222激活函数17
223损失函数19
224参数优化方法20
225误差反向传播22
226计算图28
23全连接神经网络实践项目30
231基于MLP的车牌识别32
232基于MLP的机械零件分类识别34
233基于MLP的自动驾驶数据集分类识别35
234基于MLP加速生物医学成像中的图像重建35
习题36
第3章卷积神经网络理论及实践38
31卷积神经网络理论基础38
311卷积神经网络的基本结构与特点38
312卷积层41
313池化层44
32典型的卷积神经网络模型46
321LeNet46
322AlexNet47
323VGGNet49
324GoogLeNet51
325ResNet55
33卷积神经网络实践项目57
331基于CNN的斑马线检测57
332基于多个典型CNN的眼疾数据集分类识别58
333基于飞桨高层API的交通图像分类识别58
334基于残差网络的自动驾驶数据集分类识别59
335基于残差网络的机械零件分类59
习题60
第4章基于CNN的目标检测算法及实践61
41目标检测概述61
411目标检测的基本介绍61
412目标检测算法的发展62
413数据格式与评估指标64
42两阶段目标检测算法66
421RCNN66
422SPPNet和Fast RCNN68
423Faster RCNN70
424进阶的两阶段目标检测算法72
43单阶段目标检测算法73
431YOLO系列73
432SSD80
433RetinaNet82
44Anchor Free目标检测算法83
441CornerNet83
442FCOS和CenterNet85
45目标检测实践项目86
451基于PaddleHub预训练模型的车辆目标检测86
452基于YOLOv3的自动驾驶数据集目标检测87
453基于YOLOv5的机械零件数据集目标检测88
习题89
第5章基于CNN的图像分割算法及实践91
51图像分割概述91
511图像分割的分类91
512图像分割算法的发展91
513数据格式与评估指标94
52全卷积神经网络95
521上采样方法96
522特征融合98
523FCN总结99
53UNet/SegNet99
531UNet99
532SegNet100
54DeepLab系列101
541DeepLab V1/V2102
542DeepLab V3/V3+105
55图像分割实践项目109
551基于PaddleHub预训练模型的人像分割109
552基于DeepLab V3+的自动驾驶数据集图像分割110
553基于PaddleX的医学影像视盘分割110
554基于DeepLab V3+的机械零件数据集图像分割112
习题112
第6章循环神经网络理论及实践114
61自然语言处理及其相关技术114
611自然语言处理的发展历程114
612词向量技术115
62循环神经网络117
63长短期记忆网络和门控循环单元118
631长短期记忆网络118
632门控循环单元121
64深度循环神经网络122
641堆叠循环神经网络123
642深度双向循环神经网络123
65序列到序列模型125
66循环神经网络实践项目127
661使用Gensim库进行词向量
生成127
662基于LSTM的文本情感分析128
663基于循环神经网络(GRU/LSTM)
的车辆轨迹预测128
习题129
第7章注意力机制与Transformer131
71从RNN到Transformer的演进131
711循环架构的链式衰减问题131
712时序依赖与并行计算的博弈132
713编码器解码器架构的演进132
714Transformer的里程碑意义134
72注意力机制基础134
721注意力机制的核心思想134
722传统注意力机制135
723自注意力机制136
73Transformer模型架构137
731Transformer整体架构概述137
732编码器138
733解码器141
734位置编码142
735Transformer的输入和输出143
74Transformer模型训练144
75Vision Transformer模型145
751Vision Transformer简介145
752Vision Transformer的整体结构146
76实践项目149
761Transformer注意力机制及其扩展技术实现149
762基于Transformer的文本情感分析149
763基于ViT的车辆图片分类149
764基于ViT的医学数字病理图像制片缺陷分类150
习题152
第8章生成式网络及实践154
81生成式网络概述154
82变分自编码器155
83生成对抗网络155
831生成对抗网络机理155
832生成对抗网络变体架构159
84生成扩散模型162
85基于Transformer的生成模型163
86生成式网络实践项目164
861基于生成式网络的手写数字图片生成164
862基于生成式网络的城市驾驶场景数据生成164
863基于变分自编码器的图像生成166
864基于扩散模型的车辆图像生成167
习题167
第9章强化学习理论及实践169
91强化学习概述169
911强化学习简介169
912强化学习分类170
92强化学习基础理论171
921马尔可夫决策过程171
922强化学习算法原理172
93表格型强化学习方法174
931Qlearning174
932SARSA176
94值函数强化学习方法178
941DQN178
942DDQN180
943DRQN181
95策略梯度强化学习方法182
951策略梯度计算182
952演员评论家算法183
953近端策略优化算法185
954深度确定性策略梯度算法188
955双延迟深度确定性策略梯度算法189
956SAC191
96强化学习实践项目194
961基于Qlearning的智能体配送路径规划194
962基于DQN的智能体配送路径规划194
963基于PPO小车爬坡195
习题196
第10章大模型技术及实践198
101大模型技术概述198
1011大模型的定义和分类198
1012大模型技术研究进展概述200
1013大模型发展中的伦理考量202
102大模型生成技术原理203
1021自回归生成机制203
1022检索增强生成204
1023知识处理技术206
103大模型部署优化技术207
1031模型压缩207
1032稀疏架构208
1033部署框架209
104大模型提示词工程211
105大模型训练213
106MCP模型上下文协议215
107大模型智能体218
1071LLM Agent定义与能力218
1072LLM Agent的类型与能力划分218
1073智能体系统的构建流程与运行机制218
1074典型智能体框架与工具生态219
108大模型实践项目220
1081大模型调用基础——文本与图像的生成方法220
1082文心大模型ERNIE45VL多模态应用实践221
1083文心大模型ERNIE45监督微调文本生成实践221
1084基于计算机视觉和大语言模型的智能停车场管理系统221
1085基于DeepSeek检索增强的智能问答系统222
1086基于LangChain自动驾驶决策智能体构建223
1087基于大视觉语言模型的汽车驾驶场景描述226
习题234
参考文献236