计算机视觉理论与实践
作者: 刘家瑛,杨帅,杨文瀚,段凌宇
出版时间:2022-10-19
出版社:高等教育出版社
- 高等教育出版社
- 9787040574463
- 1版
- 440611
- 44259799-3
- 16开
- 2022-10-19
- 490
- 436
- 工学
- 计算机科学与技术
- 计算机科学与技术、人工智能、电子信息
- 本科 研究生及以上
本书面向计算机视觉,聚焦算法理论与代码实践,简要介绍了计算机视觉的基本概念和计算机视觉研究的预备知识,分别讲述了图像分类、检测、生成、复原、增强、风格化与视频处理等计算机视觉领域的研究重点,深入浅出地介绍了现今已经成熟的算法和技术,并在各个章节辅以大量实例与核心代码详细展示如何使用主流框架搭建计算机视觉模型,对相关算法内容进行有效的补充和深入。通过理论与实践的结合,读者能够打下较为坚实的计算机视觉基础,熟悉经典算法框架,具备实现和改进成熟算法的能力,为进一步在计算机视觉和相关领域提出新设想、开发新算法、解决新问题创造良好的条件。
本书可作为人工智能专业和计算机类相关专业的本科生或研究生学习计算机视觉的教材,也可作为对计算机视觉技术感兴趣的科技人员、计算机爱好者及各类自学人员的参考书。
前辅文
第1章 引言
1.1 计算机视觉的基本概念
1.2 生活中的计算机视觉
1.2.1 对象识别
1.2.2 图像美化
1.2.3 图像生成
1.3 图像匹配:从SIFT 到深度学习
1.3.1 基于特征的方法
1.3.2 基于深度学习的方法
1.4 图像风格化概述:从传统到学习
1.5章节内容介绍
第2章 图像处理基础
2.1 图像的获取与表示
2.1.1 数字图像成像原理
2.1.2 图像表示
2.2 图像重采样与插值
2.3 空域变换
2.3.1 灰度变换
2.3.2 空域滤波
2.4 频域变换
2.4.1 从空域到频域
2.4.2 傅里叶级数与傅里叶变换
2.4.3 频域滤波器应用
2.5 从图像到视觉
2.5.1 图像梯度
2.5.2 图像边缘
2.5.3 霍夫变换
实践01:图像去噪:非局部均值
实践02:边缘检测
实践03:霍夫变换检测圆
实践04:二值化分割:OTSU 算法
第3章 神经网络与深度学习基础
3.1 神经网络的生物学基础
3.2 人工神经元
3.2.1 神经元的数学抽象
3.2.2 感知机模型
3.2.3 激活函数
3.2.4 多层感知机
3.3 训练人工神经网络
3.3.1 反向传播
3.3.2 损失函数
3.3.3 正则化约束
3.4 卷积神经网络
3.5 循环神经网络
实践05:实现一个简单的实用神经网络
实践06:自定义网络层
实践07:循环神经网络的构建与训练
实践08:深度学习软硬件框架
第4章 图像分类
4.1 图像分类基本原理
4.2 传统图像分类方法
4.2.1 特征提取
4.2.2 分类器
4.3 神经网络图像分类方法
4.3.1 基本原理
4.3.2 网络设计与结构演进
4.4 图像分类中的新挑战
4.4.1 细粒度图像分类
4.4.2 无监督学习图像分类
4.4.3 零样本学习图像分类
4.4.4 领域自适应学习图像分类
实践09:MNIST 手写数字分类
实践10:CIFAR-100 分类
实践11:注意力机制实现
实践12:自监督与领域自适应图像分类
第5章 目标检测
5.1 目标检测基本原理
5.1.1 问题描述
5.1.2 应用场景
5.2 传统目标检测方法
5.2.1 滑动窗口
5.2.2 特征提取
5.2.3 分类器
5.3 神经网络目标检测方法
5.3.1 基本原理
5.3.2 两阶段目标检测方法网络设计与结构演进
5.3.3 单阶段实时目标检测方法网络设计与结构演进
5.4 目标检测中的新挑战
5.4.1 零/ 小样本学习目标检测
5.4.2 迁移学习目标检测
5.4.3 恶劣环境目标检测
实践13:传统目标检测器实现
实践14:神经网络目标检测器实现
实践15:两阶段神经网络目标检测器实现
实践16:恶劣环境目标检测器实现
第6章 图像生成
6.1 深度生成模型
6.1.1 方法概览
6.1.2 变分自编码器
6.1.3 生成对抗网络
6.2 生成质量评估
6.2.1 inception score
6.2.2 FID
6.3 应用:图像转换方法
6.3.1 监督的图像转换
6.3.2 无监督的图像转换
实践17:变分自编码器
实践18:深度卷积生成对抗网络
实践19:监督图像转换网络
实践20:无监督图像转换网络
第7章 图像复原增强
7.1 图像复原增强的概念
7.1.1 成像原理与问题描述
7.1.2 应用场景
7.2 图像质量评价
7.2.1 图像质量主观评价
7.2.2 图像质量客观评价
7.3 传统图像增强
7.3.1 多项式函数估计图像插值
7.3.2 隐式的基于边缘的图像插值
7.3.3 显式的基于等照度线的图像插值
7.3.4 传统图像低光照增强
7.3.5 传统图像去雨
7.4 深度学习图像增强
7.4.1 图像超分辨率问题定义
7.4.2 超分辨率卷积神经网络重建
7.4.3 极深超分辨率重建
7.4.4 快速超分辨率重建
7.4.5 超分辨率生成对抗网络
7.4.6 基于深度学习的低光照图像增强
7.4.7 基于Retinex 模型的低光照图像增强
7.4.8 基于深度学习的去雨
7.4.9 基于区域感知的单张图像联合雨检测与去除
7.5 无监督/ 自学习图像增强
7.5.1 自监督超分辨率重建
7.5.2 无监督图像去噪
实践21:SRCNN 的实现
实践22:图像雨雾去除
实践23:RetinexNet 低光照图像增强
第8章 图像风格化
8.1 图像风格化的概念
8.1.1 问题描述
8.1.2 应用场景
8.2 传统图像风格化方法
8.2.1 基于笔画的图像风格化
8.2.2 基于样例的图像风格化
8.3 深度学习图像风格化方法
8.3.1 神经图像风格化
8.3.2 快速神经图像风格化
8.3.3 通用图像风格化
8.3.4 基于特征块的图像风格化
8.3.5 基于生成对抗网络的图像风格化
8.4 应用:文字艺术风格化方法
8.4.1 基于统计的字效迁移
8.4.2 基于特征解耦的字效迁移
实践24:神经图像风格化实现
实践25:快速神经图像风格化实现
实践26:基于特征解耦的字效迁移实现
第9章 视频——运动的图像
9.1 视频的获取与表示
9.1.1 视频的获取
9.1.2 视频的表示
9.2 运动场与光流
9.2.1 运动场
9.2.2 光流
9.3 目标跟踪的概念
9.4 传统目标跟踪方法
9.4.1 基于生成式模型的目标跟踪方法
9.4.2 基于判别式模型的目标跟踪方法
9.5 深度学习目标跟踪方法
9.5.1 基于特征预训练的目标跟踪算法
9.5.2 基于特征端到端训练的目标跟踪算法
9.6 视频人体动作识别的概念
9.7 传统视频人体动作识别方法
9.7.1 基于静态特征描述子的算法
9.7.2 基于动态轨迹的算法
9.8 基于神经网络的视频人体动作识别方法
9.8.1 基于卷积神经网络的算法
9.8.2 基于循环神经网络的算法
实践27:目标跟踪实现
实践28:动作识别实现
参考文献