图像信息处理:What is digital image processing

Chapter 1:What is digital image processing

1.1 Image acquisition 图像采集

1.1.1 Automatic aperture correction and color balance 自动光圈校正与色彩平衡

图像信息处理:What is digital image processing

Image stitching 图像缝合: Panaroma

图像信息处理:What is digital image processing

Image warping 图像扭转

图像信息处理:What is digital image processing

Image morphing

图像信息处理:What is digital image processing

1.1.2 Image reconstruction 图像重建

1.2 Display and print

1.2.1 Automatic size adjustment

图像信息处理:What is digital image processing

1.2.2 Color correction (CMYK vs. RGB)

RGB色彩模式(也翻译为“红绿蓝”,比较少用)是工业界的一种颜色标准,是通过对红®、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。

CMYK也称作印刷色彩模式,是一种依靠反光的色彩模式,和RGB类似,CMY是3种印刷油墨名称的首字母:青色Cyan、品红色Magenta、黄色Yellow。而K取的是black最后一个字母,之所以不取首字母,是为了避免与蓝色(Blue)混淆。从理论上来说,只需要CMY三种油墨就足够了,它们三个加在一起就应该得到黑色。但是由于目前制造工艺还不能造出高纯度的油墨,CMY相加的结果实际是一种暗红色。

RGB是属于色光混合,三种颜色都显示时得到的是白色,当三种颜色都不显示的时候得到的是黑色。以每种颜色的光的发光强度来表达颜色的明度和纯度。

CMYK是墨水混合,三种彩色相加得到的是黑色,三种颜色都不加,就是纸张本身的颜色。然后剩下的纯黑墨水就会用来调整色彩的明暗,色彩暗,黑色墨水就会多一些,色彩亮,黑色墨水就少或者没有。

由此可见rgb是自发光色彩,其可以表达的色彩范围几乎包含了光谱中可见的颜色,位数越高,色彩的范围就越广,而cmyk是印刷色,靠的是颜料反射光线中不同波长的光波来显示不同的色彩,根据损耗,吸收,还有颜料的品质,光线强度等,导致了cmyk的显示色彩的范围是不能和rgb相提并论的。

1.3 Storage and Transmission 存储和传输

1 High efficient storing: less temporal-spatial cost

  • Convenient transmission: Lossless, efficient, and secure

1.4 Enhancement and restoration 增强和恢复

1.4.1 Image restoration:Inpainting 图像修复

1.4.2 Improve visual effect:dehazing 去雾, retinex ,deblur 去模糊,super-resolution 超分辨率

最基本的Retinex理论与算法

Retinex是一种常用的建立在科学实验和科学分析基础上的图像增强方法,它是以人类视觉系统为出发点发展而来的一套理论方法,最早由埃德温•兰德(Edwin. H. Land)于1963年提出。Retinex是由两个单词合成的一个词语,他们分别是retina 和cortex,即视网膜和皮层。

Retinex理论的基本内容是物体的颜色是由物体对长波(红色)、中波(绿色)、短波(蓝色)光线的反射能力来决定的,而不是由反射光强度的绝对值来决定的,物体的色彩不受光照非均匀性的影响,具有一致性,即Retinex是以色感一致性(颜色恒常性)为基础的。

根据兰德提出的理论,一幅给定的图像S(x,y)S(x,y)可以分解为两个不同的图像:反射图像R(x,y)R(x,y)和亮度图像(或称之为入射图像)L(x,y)L(x,y),其原理如下图所示。

对于给定图像S中的每个点(x,y),用公式可以表示为:
S(x,y)=R(x,y)L(x,y)S(x,y)=R(x,y)*L(x,y)
S(x,y)=R(x,y)L(x,y)S(x,y)=R(x,y)*L(x,y)
实际上,Retinex理论就是通过图像S来得到物体的反射性质R,也就是设法去除(或者降低)入射光L的影响从而得到物体原本该有的样子。但是具体该如何来估计R并没有一个明确的答案,因此根据不同的估计方法,也就产生了各种各样的Retinex算法。
单尺度的Retinex算法(SSR, Single Scale Retinex)是最基础、最简单的一种Retinex算法,而且这个算法也给出了广义上Retinex算法的大致框架。

Step1:利用取对数的方法将照射光分量和反射光分量分离,即
logS(x,y)=logR(x,y)+logL(x,y)logS(x,y)=logR(x,y)+logL(x,y)
logS(x,y)=logR(x,y)+logL(x,y)log⁡S(x,y)=log⁡R(x,y)+log⁡L(x,y)
Step2:一般我们会把最终的反射图像假设地估计为空间平滑图像(其物理解释就是通过计算图像中像素点与周围区域中像素的加权平均来对图像中照度变化做估计,并将其去除,最后只保留图像中物体的反射属性),所以可以用高斯模板对原图像作卷积,即相当于对原图像作低通滤波,得到低通滤波后的图像D(x,y)D(x,y)F(x,y)F(x,y)表示高斯滤波函数:
D(x,y)=S(x,y)F(x,y)D(x,y)=S(x,y)∗F(x,y)
D(x,y)=S(x,y)F(x,y)D(x,y)=S(x,y)∗F(x,y)
Step3:在对数域中,用原图像减去低通滤波后的图像,得到高频增强的图像G(x,y)G(x,y)
G(x,y)=logS(x,y)logD(x,y)G(x,y)=logS(x,y)−logD(x,y)
G(x,y)=logS(x,y)logD(x,y)G(x,y)=log⁡S(x,y)−log⁡D(x,y)
Step4:对G(x,y)G(x,y)取反对数,得到增强后的图像R(x,y)R(x,y)
R(x,y)=expG(x,y)R(x,y)=expG(x,y)

原文:https://blog.csdn.net/baimafujinji/article/details/73824787

1.5 Recognition and understanding 识别与理解

  • Character recognition:OCR 字符识别,object detection: face detection 目标检测
  • Scene understanding:image retrieval 图像检索, scene classification 场景分类