注册 登录 进入教材巡展
#
  • #

出版时间:2019

出版社:机械工业出版社

以下为《深度学习与图像识别原理与实践》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111630036
  • 373591
  • 2019
作者简介
魏溪含

爱丁堡大学人工智能硕士,□□□□达摩院算法专家,在计算机视觉、大数据领域有8年以上的算法架构和研发经验。
在大数据领域,曾带领团队对□□□□个性化推荐系统进行升级;计算机视觉领域,主导并攻克了光伏EL全自动瑕疵识别的世界难题,并在行为识别领域带领团队参赛打破世界纪录等。


涂铭
□□□□数据架构师,对大数据、自然语言处理、图像识别、Python、Java相关技术有深入的研究,积累了丰富的实践经验。在工业领域曾参与了燃煤优化、设备故障诊断项目,正泰光伏电池片和组件EL图像检测项目;在自然语言处理方面,担任导购机器人项目的架构师,主导开发机器人的语义理解、短文本相似度匹配、上下文理解,以及通过自然语言检索产品库,在项目中构建了NoSQL+文本检索等大数据架构,也同时负责问答对的整理和商品属性的提取,带领NLP团队构建语义解析层。

张修鹏
毕业于中南大学,□□□□技术发展专家,长期从事云计算、大数据、人工智能与物联网技术的商业化应用,在□□□□首次将图像识别技术引入工业,并推动图像识别产品化、平台化,擅于整合前沿技术解决产业问题,主导多个大数据和AI为核心的数字化转型项目成功实施,对技术和商业结合有着深刻的理解。
查看全部
内容简介
这是一部从技术原理、算法和工程实践3个维度系统讲解图像识别的著作,由□□□□达摩院算法专家、□□□□技术发展专家、□□□□数据架构师联合撰写。

在知识点的选择上,本书广度和深度兼顾,既能让完全没有基础的读者迅速入门,又能让有基础的读者深入掌握图像识别的核心技术;在写作方式上,本书避开了复杂的数学公式及其推导,从问题的前因后果 、创造者的思考过程,利用简单的数学计算来做模型分析和讲解,通俗易懂。更重要的书,本书不仅仅是聚焦于技术,而是将重点放在了如何用技术解决实际的业务问题。

全书一共13章:

□□-□章主要介绍了图像识别的应用场景、工具和工作环境的搭建;

第3-6章详细讲解了图像分类算法、机器学□、□经网络、误差反向传播等图像识别的基础技术及其原理;

第7章讲解了如何利用PyTorch来实现神经网络的图像分类,专注于实操,是从基础向高阶的过渡;

第8-1□章深入讲解了图像识别的核心技术及其原理,包括卷积神经网络、目标检测、分割、产生式模型、神经网络可视化等主题;

□□3章从工程实践的角度讲解了图像识别算法的部署模式。
目录
前言
□□章 机器视觉在行业中的应用1
1.1 机器视觉的发展背景1
1.1.1 人工智能1
1.1.□ 机器视觉□
1.□ 机器视觉的主要应用场景3
1.□.1 人脸识别3
1.□.□ □□监控分析4
1.□.3 工业瑕疵检测5
1.□.4 图片识别分析6
1.□.5 自动驾驶/驾驶辅助7
1.□.6 三维图像视觉8
1.□.7 医疗影像诊断8
1.□.8 文字识别9
1.□.9 图像/□□的生成及设计9
1.3 本章小结10
第□章 图像识别前置技术11
□.1 深度学习框架11
□.1.1 Thea□□□1
□.1.□ Tensorflow1□
□.1.3 MXNet13
□.1.4 Keras13
□.1.5 PyTorch14
□.1.6 Caffe14
□.□ 搭建图像识别开发环境15
□.□.1 Anaconda15
□.□.□ conda18
□.□.3 Pytorch的下载与安装19
□.3 Numpy使用详解□0
□.3.1 创建数组□0
□.3.□ 创建Numpy数组□□
□.3.3 获取Numpy属性□4
□.3.4 Numpy数组索引□5
□.3.5 切片□5
□.3.6 Numpy中的矩阵运算□6
□.3.7 数据类型转换□7
□.3.8 Numpy的统计计算方法□8
□.3.9 Numpy中的arg运算□9
□.3.10 FancyIndexing□9
□.3.11 Numpy数组比较30
□.4 本章小结31
第3章 图像分类之KNN算法3□
3.1 KNN的理论基础与实现3□
3.1.1 理论知识3□
3.1.□ KNN的算法实现33
3.□ 图像分类识别预备知识35
3.□.1 图像分类35
3.□.□ 图像预处理36
3.3 KNN实战36
3.3.1 KNN实现MNIST数据分类36
3.3.□ KNN实现Cifar10数据分类41
3.4 模型参数调优44
3.5 本章小结48
第4章 机器学习基础49
4.1 线性回归模型49
4.1.1 一元线性回归50
4.1.□ 多元线性回归56
4.□ 逻辑回归模型57
4.□.1 Sigmoid函数58
4.□.□ 梯度下降法59
4.□.3 学习率的分析61
4.□.4 逻辑回归的损失函数63
4.□.5 Python实现逻辑回归66
4.3 本章小结68
第5章 神经网络基础69
5.1 神经网络69
5.1.1 神经元70
5.1.□ 激活函数7□
5.1.3 前向传播76
5.□ 输出层80
5.□.1 Softmax80
5.□.□ one-hotencoding8□
5.□.3 输出层的神经元个数83
5.□.4 MNIST数据集的前向传播83
5.3 批处理85
5.4 广播原则87
5.5 损失函数88
5.5.1 均方误差88
5.5.□ 交叉熵误差89
5.5.3 Mini-batch90
5.6 □优化91
5.6.1 随机初始化91
5.6.□ 跟随梯度(数值微分)9□
5.7 基于数值微分的反向传播98
5.8 基于测试集的评价101
5.9 本章小结104
第6章 误差反向传播105
6.1 激活函数层的实现105
6.1.1 ReLU反向传播实现106
6.1.□ Sigmoid反向传播实现106
6.□ Affine层的实现107
6.3 Softmaxwithloss层的实现108
6.4 基于数值微分和误差反向传播的比较109
6.5 通过反向传播实现MNIST识别111
6.6 正则化惩罚114
6.7 本章小结115
第7章 PyTorch实现神经网络图像分类116
7.1 PyTorch的使用116
7.1.1 Tensor116
7.1.□ Variable117
7.1.3 激活函数118
7.1.4 损失函数1□0
7.□ PyTorch实战1□□
7.□.1 PyTorch实战之MNIST分类1□□
7.□.□ PyTorch实战之Cifar10分类1□5
7.3 本章小结1□8
第8章 卷积神经网络1□9
8.1 卷积神经网络基础1□9
8.1.1 全连接层1□9
8.1.□ 卷积层130
8.1.3 池化层134
8.1.4 批规范化层135
8.□ 常见卷积神经网络结构135
8.□.1 AlexNet136
8.□.□ VGGNet138
8.□.3 GoogLeNet140
8.□.4 ResNet14□
8.□.5 其他网络结构144
8.3 VGG16实现Cifar10分类145
8.3.1 训练146
8.3.□ 预测及评估149
8.4 本章小结15□
8.5 参考文献15□
第9章 目标检测153
9.1 定位+分类153
9.□ 目标检测155
9.□.1 R-CNN156
9.□.□ Fast R-CNN160
9.□.3 Faster R-CNN16□
9.□.4 YOLO165
9.□.5 SSD166
9.3 SSD实现VOC目标检测167
9.3.1 PASCAL VOC数据集167
9.3.□ 数据准备170
9.3.3 构建模型175
9.3.4 定义Loss178
9.3.5 SSD训练细节181
9.3.6 训练186
9.3.7 测试189
9.4 本章小结190
9.5 参考文献191
□□0章 分割19□
10.1 语义分割193
10.1.1 FCN193
10.1.□ UNet实现裂纹分割196
10.1.3 SegNet□09
10.1.4 PSPNet□10
10.□ 实例分割□11
10.□.1 层叠式□1□
10.□.□ 扁平式□1□
10.3 本章小结□13
10.4 参考文献□14
□□1章 产生式模型□15
11.1 自编码器□15
11.□ 对抗生成网络□15
11.3 DCGAN及实战□17
11.3.1 数据集□18
11.3.□ 网络设置□□0
11.3.3 构建产生网络□□1
11.3.4 构建判别网络□□3
11.3.5 定义损失函数□□4
11.3.6 训练过程□□4
11.3.7 测试□□7
11.4 其他GAN□30
11.5 本章小结□35
11.6 参考文献□35
□□□章 神经网络可视化□36
1□.1 卷积核□36
1□.□ 特征层□37
1□.□.1 直接观测□37
1□.□.□ 通过重构观测□39
1□.□.3 末端特征激活情况□43
1□.□.4 特征层的作用□44
1□.3 图片风格化□45
1□.3.1 理论介绍□45
1□.3.□ 代码实现□47
1□.4 本章小结□55
1□.5 参考文献□55
□□3章 图像识别算法的部署模式□57
13.1 图像算法部署模式介绍□57
13.□ 实际应用场景和部署模式的匹配□6□
13.3 案例介绍□64
13.4 本章小结□65