1. 图像

1.1 基本概念

像素(px)：像素是分辨率的单位。像素是构成位图图像最基本的单元，每个像素都有自己的颜色。每张图片都是由色点组成的，每个色点称为一个像素。
- 一个像素多大？——取决于显示屏的分辨率
分辨率（又称解析度、解像度），可以细分为显示分辨率、图像分辨率、打印分辨率和扫描分辨率等
a) 图像分辨率就是 单位英寸内的像素点数。单位为PPI(Pixels Per Inch)；分辨率越高，像素的点密度越高，图像越逼真
b）屏幕分辨率：屏幕分辨率是屏幕每行的像素点数每列的像素点数，每个屏幕有自己的分辨率。屏幕分辨率越高，所呈现的色彩越多，清晰度越高。 —— 故，电子设备只说分辨率是多少多少，是不能代表清晰度
灰度：表示图像像素明暗程度的数值，也就是黑白图像中点的颜色深度。范围一般为0-255。白色为
255，黑色为0。（黑白灰）
色调：各种图像色彩模式下原色的明暗程度，级别范围从0到255，共256级色调。
通道：把图像分解成一个或多个颜色成分：
①单通道：一个像素点只需一个数值表示，只能表示灰度，0为黑色；（二值图&灰度图）
②三通道：RGB模式，把图像分为红绿蓝三个通道，可以表示彩色，全0表示黑色；
③四通道：RGBA模式，在RGB基础上加上alpha通道，表示透明度，alpha=0表示全透明
对比度：指不同颜色之间的差别。对比度=最大灰度值/最小灰度值
- 对比度过大会比较刺眼
- 计算方式：根据自己定义。可以只对比一个通道对比度；也可以对比三通道均值的对比度（一般情况是均值作为对比度）
频率: 灰度值变化剧烈程度的指标，是灰度在平面空间上的梯度。
- 高频：如相邻之间的灰度变化很快（值差距大）
- 低频：两个像素点之间一样或变化较小
幅值: 幅值是在一个周期内，交流电瞬时出现的最大绝对值，也是一个正弦波，波峰到波谷的距离的一半。

1.2 RGB模型

色彩三原色（CMYK）：品红、黄、青
光学三原色（RGB）：红、绿、蓝

RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体
在正方体的主对角线上，各原色的量相等，产生由暗到亮的白色。即灰度。(0,0,0)为黑，(1,1,1)为白，正方体的其他6个角点分别为红、黄、绿、青、蓝和品红
2 图像和视频

1.3 为什么很多图像识别将彩色图像灰度化？

很多图像识别的应用，都会将彩色图像灰度化（变为灰度图）

很多情况下，我们只是识别图像，不需要识别颜色
颜色信息丢失，但物体信息不会丢失

没有用
增加计算量

1.4 如何灰度化？

（三值 -> 一值）

三通道取均值
三通道分配权重

1.5 如何操作RGB值？

RGB值转化为浮点数

浮点数运算结果更精确，整数运算中会因丢弃小数部分可能导致颜色值严重失
真，计算过程越多越失真
将RGB值转化为[0,1]浮点数（值/255）

[注] 黑白图像是二值图像（0，1），没有灰

2. 图像的取样与量化

数字图像：计算机保存的图像都是一个一个的像素点，称为数字图像。
- 每个像素点都会有一个灰度值，即它的数字
图像数字化过程由图像的取样与量化来完成。
图像数字化过程：现实看到的图像转化为计算机处理的、由一个一个像素点组成的数字图像
- 取样：就是要用多少点来描述一幅图像，取样结果质量的高低就是用图像的分辨率来衡量的
- 量化：是指要使用多大范围的数值来表示图像采样之后的一个点。
  - 范围大：颜色更加真实

[总结]
数字化坐标值称为取样，数字化幅度值称为量化。

在取样时，若横向的像素数（列数）为M ，纵向的像素数（行数）为N，则图像总像素数为 M*N 个像素。

清晰度 & 计算量的 trade-off

需要考虑的因素：

正确性（清晰度）

性能

功耗（省电）（计算量少）

3. 上采样与下采样

缩小图像（或称为下采样（subsampled）或降采样（downsampled））的主要目的
有两个：1、使得图像符合显示区域的大小；2、生成对应图像的缩略图。
放大图像（或称为上采样（upsampling）或图像插值（interpolating））的主要目的
是放大原图像,从而可以显示在更高分辨率的显示设备上。