- 高等教育出版社
- 9787040600865
- 1版
- 468678
- 46252224-4
- 平装
- 16开
- 2023-08
- 410
- 285
- 电气自动化类
- 本科
本书主要介绍机器视觉基础理论与应用技术。 首先介绍了机器视觉技术发展过程与趋势,进而介绍了机器视觉的基本理论,主要包括图像与视频预处理技术、图像去噪与增强技术、图像分割技术、图像特征描述方法、图像几何变换与映射、相机模型与多视图几何、目标分类识别技术、深度学习与机器视觉,最后,介绍了机器视觉技术在手势识别、车辆检测、人脸识别、医学诊断、人体姿态估计、水下图像目标检测等领域的典型应用案例。
本书可作为高等院校机器人工程、自动化、人工智能、计算机科学与技术、电气工程及其自动化、电子科学与技术等专业的教材,也可作为相关专业的教学参考书。 同时,也可供机器视觉、图像处理、智能机器人、人工智能、智能无人系统等领域的研究生与工程技术人员参考。
前辅文
第1章 绪论
1.1 机器视觉概述
1.1.1人类视觉系统模型
1.1.2机器视觉系统模型
1.2 机器视觉发展过程
1.3 机器视觉系统基本构成
1.3.1机器视觉系统硬件构成
1.3.2机器视觉系统软件及编程工具
1.3.3机器视觉硬件系统与软件系统关系
1.4 典型的机器视觉技术
1.4.1尺寸测量
1.4.2缺陷检测
1.4.3图像融合
1.4.4目标跟踪
1.4.5三维重构
1.5 机器视觉技术应用领域
1.5.1制造业应用
1.5.2农业应用
1.5.3汽车行业应用
1.5.4医学应用
1.6 机器视觉未来发展趋势
1.6.1多传感器信息融合方法研究
1.6.2深层初级视觉理论和方法研究
1.6.3主动视觉研究
1.6.4完整三维场景重构
1.6.5视觉并行计算结构研究
1.6.6通用视觉信息系统研究
习题
第2章 图像与视频预处理技术
2.1 图像格式
2.1.1BMP图像
2.1.2GIF图像
2.1.3PNG图像
2.1.4TIFF图像
2.1.5JPEG.2000图像
2.2 视频格式
2.2.1AVS视频
2.2.2HDV视频
2.2.3WMV视频
2.3 灰度图像预处理
2.3.1函数灰度变换
2.3.2直方图类方法
2.3.3几何变换
2.4 彩色图像预处理
2.4.1颜色模型
2.4.2灰度图像与彩色图像的转换
2.4.3彩色图像平衡与补偿
2.5 视频流处理
2.5.1视频镜头分割
2.5.2关键帧提取
2.5.3视频特征提取
习题
第3章 图像去噪与增强技术
3.1 图像噪声与退化模型
3.1.1图像噪声的概念
3.1.2图像噪声的成因和来源
3.1.3常见的噪声
3.1.4图像退化/复原模型
3.2 空间滤波基础
3.2.1空间卷积
3.2.2空间滤波的向量形式
3.2.3滤波器模板
3.3 基于空间滤波的图像去噪
3.3.1均值滤波
3.3.2高斯滤波
3.3.3统计顺序滤波
3.3.4非局部均值滤波
3.4 基于空间滤波的图像增强
3.4.1梯度增强
3.4.2拉普拉斯算子
3.4.3混合空间图像增强
3.5 频域滤波基础
3.5.1二维傅里叶变换
3.5.2频域滤波基本步骤
3.5.3空间域与频率域的对应关系
3.6 基于频域滤波的图像去噪
3.6.1理想低通滤波器
3.6.2巴特沃思低通滤波器
3.6.3高斯低通滤波器
3.6.4其他低通滤波器举例
3.7 基于频域滤波的图像增强
3.7.1理想高通滤波器
3.7.2巴特沃思高通滤波器
3.7.3高斯高通滤波器
3.7.4拉普拉斯算子的频域形式
3.7.5同态滤波
习题
第4章 图像分割技术
4.1 图像分割的概念
4.2 图像边缘检测
4.2.1孤立点检测
4.2.2线检测
4.2.3边缘模型
4.2.4边缘检测方法
4.3 基于阈值的图像分割方法
4.3.1全局阈值分割
4.3.2基于Otsu方法的全局最优阈值分割
4.3.3改进全局阈值的分割方法
4.3.4多阈值分割、可变阈值分割、多变量阈值分割
4.4 基于区域的图像分割方法
4.4.1区域生长算法
4.4.2区域分裂与聚合
4.5 基于形态学的图像分割方法
4.5.1分水岭分割算法
4.5.2水平集分割算法
习题
第5章 图像特征描述方法
5.1 图像表示
5.1.1边界追踪表示
5.1.2链码表示
5.1.3多边形近似表示
5.1.4骨架表示
5.2 边界描述子
5.2.1简单边界描述子
5.2.2形状数
5.2.3傅里叶描述子
5.2.4统计矩描述子
5.2.5Harris角点描述子
5.2.6尺度不变特征变换(SIFT)描述子
5.2.7Hough变换描述子
5.3 区域描述子
5.3.1简单区域描述子
5.3.2纹理描述子
5.3.3不变矩
习题
第6章 图像几何变换与映射
6.1 射影几何基础
6.1.1射影空间中点和超平面
6.1.2齐次坐标的理解
6.2 图像处理坐标系
6.2.1图像坐标系
6.2.2相机坐标系
6.2.3世界坐标系
6.3 坐标变换
6.3.1坐标平移
6.3.2坐标伸缩
6.3.3坐标旋转
6.3.4坐标系变换
6.4 变换模型
6.4.1欧氏变换模型
6.4.2相似变换模型
6.4.3仿射变换模型
6.4.4投影变换模型
6.5 图像映射
6.5.1单应性变换
6.5.2图像扭曲
6.5.3全景图创建
6.5.4图像配准
习题
第7章 相机模型与多视图几何
7.1 针孔相机模型
7.1.1相机矩阵
7.1.2相机点的投影
7.1.3相机矩阵分解
7.1.4相机中心位置计算
7.2 相机标定
7.2.1相机标定原理
7.2.2相机畸变
7.2.3相机标定
7.2.4相机位置与方向
7.3 多视图几何
7.3.1对极几何
7.3.2相机与三维结构计算
7.3.3多视图重建
7.3.4立体图像获取
习题
第8章 目标分类识别技术
8.1 类与模式
8.2 无监督分类识别技术
8.2.1K-means聚类分类法
8.2.2模糊C均值聚类分类法
8.2.3Mean-Shift聚类分类法
8.2.4Super-Pixel聚类分类法
8.3 有监督分类识别技术
8.3.1K近邻分类识别算法
8.3.2决策树分类识别算法
8.3.3贝叶斯分类识别算法
8.3.4逻辑回归分类识别技术
8.4 神经网络分类识别技术
8.5 模糊神经网络分类识别技术
8.5.1模糊理论概述
8.5.2模糊理论与神经网络的融合
8.5.3基于自适应模糊神经网络的分类器设计
习题
第9章 深度学习与机器视觉
9.1 深度学习的发展
9.2 深度学习基本思想
9.3 常用深度学习方法
9.4 深度学习训练机制
9.4.1特殊的有监督训练模式
9.4.2训练注意事项
9.4.3欠拟合和过拟合
9.5 卷积神经网络
9.5.1激活函数
9.5.2损失函数
9.5.3优化函数
9.5.4卷积层
9.5.5池化层
9.5.6全连接层
9.5.7感受野
9.5.8卷积神经网络的特点
9.6 典型深度学习网络
9.6.1LeNet网络
9.6.2AlexNet网络
9.6.3VGG网络
9.6.4GoogLeNet网络
9.6.5Faster R-CNN网络
9.6.6YOLO系列网络
9.7 深度学习网络改进策略
9.7.1注意力机制
9.7.2Transformer
习题
第10章 机器视觉技术应用案例
10.1 基于机器视觉的手势估计
10.1.1手势识别和姿态估计简介
10.1.2案例概况
10.2 基于机器视觉的全景拼接技术
10.2.1图像拼接简介
10.2.2案例概况
10.3 行为识别
10.3.1行为识别简介
10.3.2案例概况
10.4 行人检测技术
10.4.1行人检测技术简介
10.4.2案例概况
10.5 车辆检测
10.5.1车辆检测简介
10.5.2案例概况
10.6 人脸识别技术
10.6.1人脸识别技术简介
10.6.2案例概况
10.7 基于视觉的人体姿态估计技术
10.7.1人体姿态估计简介
10.7.2案例概况
10.8 水下图像目标检测
10.8.1水下图像目标检测简介
10.8.2案例概况
10.9 基于视觉的计算机辅助诊断技术
10.9.1计算机辅助诊断技术简介
10.9.2案例概况
参考文献