图像处理基础-旋转(rotation), 平移(shift), 缩放(scale), 错切(shear)

最近在学习data augmentation的一些方法，在训练模型时经常碰到训练数据不够的情况，尤其是图像方面的模型，例如CNN。这时候对数据进行增强可以大大扩充训练集的规模，对模型的最终的准确度和泛化能力都有很大的帮助，有时甚至是决定性的作用

今天先学习了下图像方面的增强方法，主要是对图像进行小幅度的旋转，平移，缩放和错切，这4个方面的变换可以组成任意的affine transformation。实际应用时就是把原有数据的不同尺寸的图片缩放到相同尺寸，并添加随机的小幅度旋转，平移和错切来生成大量额外训练数据。

旋转

图片画的不是特别好，请轻吐槽
原有的点(X,Y)和坐标轴夹角 $θ$ ,旋转 $α$ 角度后到达 $(\overset{´}{X}, \overset{´}{Y})$ , 记(X,Y)的模为L，那么:

$\begin{aligned} L * c o s (θ) = X \\ L * s i n (θ) = Y \\ L * c o s (θ + α) = \overset{´}{X} \\ L * s i n (θ + α) = \overset{´}{Y} \end{aligned}$

从三角公式可得：
$\begin{aligned} L * (c o s (θ) * c o s (α) - s i n (θ) * s i n (α)) = \overset{´}{X} \\ L * (s i n (θ) * c o s (α) + c o s (θ) * s i n (α)) = \overset{´}{Y} \end{aligned}$
代入初始公式：
$\begin{aligned} X * c o s (α) - Y * s i n (α) = \overset{´}{X} \\ Y * c o s (α) + X * s i n (α) = \overset{´}{Y} \end{aligned}$
最终得到:
$[\begin{matrix} \overset{´}{X} \\ \overset{´}{Y} \\ 1 \end{matrix}] = [\begin{matrix} c o s (α) & - s i n (α) & 0 \\ s i n (α) & c o s (α) & 0 \\ 0 & 0 & 1 \end{matrix}] * [\begin{matrix} X \\ Y \\ 1 \end{matrix}]$
平移
平移比较简单
$\begin{aligned} X + X_{t} = \overset{´}{X} \\ Y + Y_{t} = \overset{´}{Y} \end{aligned}$
写成类似形式
$[\begin{matrix} \overset{´}{X} \\ \overset{´}{Y} \\ 1 \end{matrix}] = [\begin{matrix} 1 & 0 & X_{t} \\ 0 & 1 & Y_{t} \\ 0 & 0 & 1 \end{matrix}] * [\begin{matrix} X \\ Y \\ 1 \end{matrix}]$
缩放
缩放和平移类似，也比较简单
$\begin{aligned} X * X_{z o o m} = \overset{´}{X} \\ Y * Y_{z o o m} = \overset{´}{Y} \end{aligned}$

写成类似形式
$[\begin{matrix} \overset{´}{X} \\ \overset{´}{Y} \\ 1 \end{matrix}] = [\begin{matrix} X_{z o o m} & 0 & 0 \\ 0 & Y_{z o o m} & 0 \\ 0 & 0 & 1 \end{matrix}] * [\begin{matrix} X \\ Y \\ 1 \end{matrix}]$
1. 错切
  
  错切可以通过矩形变成平行四边形来理解，错切可以沿着任意一个坐标轴进行，图例是沿着Y轴进行错切
  $\begin{aligned} X + s i n (θ) * Y = \overset{´}{X} \\ Y * c o s (θ) = \overset{´}{Y} \end{aligned}$
  写成类似形式
  $[\begin{matrix} \overset{´}{X} \\ \overset{´}{Y} \\ 1 \end{matrix}] = [\begin{matrix} 1 & s i n (θ) & 0 \\ 0 & c o s (θ) & 0 \\ 0 & 0 & 1 \end{matrix}] * [\begin{matrix} X \\ Y \\ 1 \end{matrix}]$
  欢迎大家批评指正！

图像处理基础-旋转(rotation), 平移(shift), 缩放(scale), 错切(shear)

相关推荐