深度学习第五节(计算机视觉基础)
深度学习第五节(计算机视觉基础)
计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。
1.图像表示
数字图像文件由像素数组成,像素是图像的最小构成元素,在灰度图像中,每个元素都是0-255之间的标量值。0是黑色,255是白色,介于0到255之间的值都是灰色值(像素值越小,像素越暗)

特定颜色可以由红绿蓝值分量合成表示,将像素值表示为RGB三元组(r,g,b)
2.将图像转换为结构化数组
2.1灰度图像表示
将灰度图像转换为结构化数组,并进行可视化。
1.导入cv2(用于从磁盘读取图像)和matplotlib(用于绘制加载的图像)库并读取图像:
1 | import cv2 |
2.裁剪第100-600行以及第100-900列之间的图像,将图像转换为灰度图像并进行绘制。
1 | img = img[100:600,100:900] |
得到500×800的像素数组
1 | img_gray_small = cv2.resize(img_gray,(40,25)) |
检查像素值
1 | print(img_gray_small) |
2.2彩色图像表示
上述步骤可以用于彩色图像上,每个像素可以表示为3维向量,最亮的红色像素表示为(255,0,0),图像中的纯白色像素表示为(255,255,255)。将彩色图像转换为结构化数组。
1 | import cv2 |
1.裁剪图像并绘制图像
1 | img = img[100:600,100:900] |
cv2.cvtColor对通道进行重新排序,cv2导入图像时通道顺序时BGR,但通常是以RGB通道查看图像。
2.打印右下角的3×3像素阵列,并绘制像素值
1 | crop = img[-3:,-3:] |

3.利用神经网络进行图像分析的优势




传统特征提取不能保证在应用场景中起作用,基于神经网络的模型不仅能提取正确的特征,还能学习如何进行最佳组合来完成目标任务,解决了传统特征提取的缺点。神经网络既可以作为特征提取器也可以作为分类器

All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.