深度学习第五节（计算机视觉基础）

计算机视觉是指通过计算机系统对图像和视频进行处理和分析，利用计算机算法和方法，使计算机能够模拟和理解人类的视觉系统。

1.图像表示

数字图像文件由像素数组成，像素是图像的最小构成元素，在灰度图像中，每个元素都是0-255之间的标量值。0是黑色，255是白色，介于0到255之间的值都是灰色值（像素值越小，像素越暗）

特定颜色可以由红绿蓝值分量合成表示，将像素值表示为RGB三元组（r,g,b)

2.将图像转换为结构化数组

2.1灰度图像表示

将灰度图像转换为结构化数组，并进行可视化。

1.导入cv2（用于从磁盘读取图像）和matplotlib（用于绘制加载的图像）库并读取图像：

import cv2
import matplotlib.pyplot as plt
img = cv2.imread('1.jpeg')
#读取图像并将图像转换为像素值数组

2.裁剪第100-600行以及第100-900列之间的图像，将图像转换为灰度图像并进行绘制。

img = img[100:600,100:900]
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#OpenCV 读入的彩色图像是 BGR 顺序
plt.imshow(img_gray,cmap='gray')#cmap='gray' 保证 Matplotlib 不会自动加伪彩色
plt.show()

得到500×800的像素数组

1
2
3

img_gray_small = cv2.resize(img_gray,(40,25))
plt.imshow(img_gray_small,cmap='gray')
plt.show()

检查像素值

print(img_gray_small)
#[[127  51  33  31  35  35  38  50  17  92  71 115 179 239 245 220  77 134
  176 188 193 184 142 127 125  70 177 109 102 118 116 134  55  71  64 119
   78  44 110 157]
 [ 73 113 123 171  20 120  41  30 208  70 161  89 196 226 233 193 104 144
  173 182 232 154 159  88  37 179 103  82 101 219 226 233 100  77  38 157
   52  48  96 150]
 ..........
 [ 57  27  47  60  95 100 111 132 188 114  80 145 181 135 106  76  71  68
   95 161 117  80  97 103  54  27  48  41  35  35  46  52  53  58  47  52
   52  52  47  41]]

2.2彩色图像表示

上述步骤可以用于彩色图像上，每个像素可以表示为3维向量，最亮的红色像素表示为（255，0，0），图像中的纯白色像素表示为（255，255，255）。将彩色图像转换为结构化数组。

1
2
3

import cv2
import matplotlib.pyplot as plt
img = cv2.imread('1.jpeg')

1.裁剪图像并绘制图像

img = img[100:600,100:900]
img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#OpenCV 读入的彩色图像是 BGR 顺序
plt.imshow(img)
plt.show()
print(img.shape)

cv2.cvtColor对通道进行重新排序，cv2导入图像时通道顺序时BGR，但通常是以RGB通道查看图像。

2.打印右下角的3×3像素阵列，并绘制像素值

crop = img[-3:,-3:]
print(crop)

plt.imshow(crop)
plt.show()

3.利用神经网络进行图像分析的优势

传统特征提取不能保证在应用场景中起作用，基于神经网络的模型不仅能提取正确的特征，还能学习如何进行最佳组合来完成目标任务，解决了传统特征提取的缺点。神经网络既可以作为特征提取器也可以作为分类器