深度学习第五节(计算机视觉基础)

​ 计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。

1.图像表示

​ 数字图像文件由像素数组成,像素是图像的最小构成元素,在灰度图像中,每个元素都是0-255之间的标量值。0是黑色,255是白色,介于0到255之间的值都是灰色值(像素值越小,像素越暗)

image-20250913192819008

image-20250913193402893

特定颜色可以由红绿蓝值分量合成表示,将像素值表示为RGB三元组(r,g,b)

2.将图像转换为结构化数组

2.1灰度图像表示

​ 将灰度图像转换为结构化数组,并进行可视化。

1.导入cv2(用于从磁盘读取图像)和matplotlib(用于绘制加载的图像)库并读取图像:

1
2
3
4
import cv2
import matplotlib.pyplot as plt
img = cv2.imread('1.jpeg')
#读取图像并将图像转换为像素值数组

2.裁剪第100-600行以及第100-900列之间的图像,将图像转换为灰度图像并进行绘制。

1
2
3
4
img = img[100:600,100:900]
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#OpenCV 读入的彩色图像是 BGR 顺序
plt.imshow(img_gray,cmap='gray')#cmap='gray' 保证 Matplotlib 不会自动加伪彩色
plt.show()

得到500×800的像素数组

1
2
3
img_gray_small = cv2.resize(img_gray,(40,25))
plt.imshow(img_gray_small,cmap='gray')
plt.show()

检查像素值

1
2
3
4
5
6
7
8
9
10
11
print(img_gray_small)
#[[127 51 33 31 35 35 38 50 17 92 71 115 179 239 245 220 77 134
176 188 193 184 142 127 125 70 177 109 102 118 116 134 55 71 64 119
78 44 110 157]
[ 73 113 123 171 20 120 41 30 208 70 161 89 196 226 233 193 104 144
173 182 232 154 159 88 37 179 103 82 101 219 226 233 100 77 38 157
52 48 96 150]
..........
[ 57 27 47 60 95 100 111 132 188 114 80 145 181 135 106 76 71 68
95 161 117 80 97 103 54 27 48 41 35 35 46 52 53 58 47 52
52 52 47 41]]

2.2彩色图像表示

​ 上述步骤可以用于彩色图像上,每个像素可以表示为3维向量,最亮的红色像素表示为(255,0,0),图像中的纯白色像素表示为(255,255,255)。将彩色图像转换为结构化数组。

1
2
3
import cv2
import matplotlib.pyplot as plt
img = cv2.imread('1.jpeg')

1.裁剪图像并绘制图像

1
2
3
4
5
img = img[100:600,100:900]
img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#OpenCV 读入的彩色图像是 BGR 顺序
plt.imshow(img)
plt.show()
print(img.shape)

cv2.cvtColor对通道进行重新排序,cv2导入图像时通道顺序时BGR,但通常是以RGB通道查看图像。

2.打印右下角的3×3像素阵列,并绘制像素值

1
2
3
4
5
crop = img[-3:,-3:]
print(crop)

plt.imshow(crop)
plt.show()
image-20250913203932993

3.利用神经网络进行图像分析的优势

image-20250913204506467 image-20250913204546975 image-20250913204611022 image-20250913204638949

​ 传统特征提取不能保证在应用场景中起作用,基于神经网络的模型不仅能提取正确的特征,还能学习如何进行最佳组合来完成目标任务,解决了传统特征提取的缺点。神经网络既可以作为特征提取器也可以作为分类器

image-20250913205106413