python用opencv读取图像如何做格式转换

在python中用cv2读取图像文件或摄像头，都能获取一帧图像，如

import cv2
frame1 = cv2.imread(“a.jpg”)
cap = cv2.VideoCapture(0)
rval, frame2 = cap.read()

上面获得的frame1和frame2都是numpy array格式的。但是有时候我们想要把它转成自己的格式，比如有时候可能需要调用C++函数，比如在darknet中，这时就要进行格式转换。这个方法有如下几种：

存成文件，再用相应的读文件方法读取
这种方法这里不谈，毕竟频繁地读写文件的方法在很多场合下是不可取的，其实速度还可以，但仍然不是一种完美的方式。
直接在python中做格式转换
既然知道frame是numpy array格式，当然可以直接做转换，但是在python中进行这种操作非常耗时。笔者测试了一下，转换一张416x416x3的图像大约需要3秒钟。这个速度甚至不如用文件转存的方式。
本文重点要说的，是通过C函数进行转换
首先，从numpy array获得C数据指针：

h,w,c=frame1.shape
if not frame1.flags[‘C_CONTIGUOUS’]:
frame1= np.ascontiguousarray(frame1, dtype=frame1.dtype) # 转换成连续存放
data_ptr = cast(frame1.ctypes.data, c_char_p)

这个data_ptr 就是所要传递给C函数的数据指针，此外还得到了图像高度h，宽度w和通道数c。

下面要做的，是在python中声明一个自己定义的C函数mat2local_image，比如在darknet中：

lib = CDLL(“libdarknet.so”, RTLD_GLOBAL)
mat2local_image = lib.mat2local_image
mat2local_image.argtypes = [c_int,c_int,c_int,c_char_p]
mat2local_image.restype = IMAGE

其中IMAGE是自己定义的数据格式，比如在darknet中是这样定义的：

class IMAGE(Structure):
fields = [(“w”, c_int),
(“h”, c_int),
(“c”, c_int),
(“data”, POINTER(c_float))]

此外，你还要在C文件中定义一个C函数mat2local_image，例如在darknet中：

image mat2local_image(int w, int h, int c, unsigned char *data)
{
int i, j, k;
image im = make_image(w, h, c);
for(i = 0; i < h; ++i){
for(k= 0; k < c; ++k){
for(j = 0; j < w; ++j){//data is BGR, so c-k-1 to reverse to RGB
im.data[k*w*h + i*w + j] = data[i*w*c + j*c + c-k-1]/255.;
}
}
}
//It has been reversed to RGB
//rgbgr_image(im);
return im;
}

注意，因为cv2读图像的格式是BGR，所以在转换时，需要将R,B交换。在这个函数中，我们直接通过c-k-1进行这个交换，而不需要调用rgbgr_image函数。然后把C文件编译成.so。

现在，你可以在python中调用这个函数了：

def image_mat2local(image_mat):
h,w,c=frame1.shape
if not frame1.flags[‘C_CONTIGUOUS’]:
frame1= np.ascontiguousarray(frame1, dtype=frame1.dtype) # 转换成连续存放
data_ptr = cast(frame1.ctypes.data, c_char_p)
im = mat2local_image(w,h,c,data_ptr)
return im

请关注爱在上工：
python用opencv读取图像如何做格式转换

python用opencv读取图像如何做格式转换

python用opencv读取图像如何做格式转换

相关推荐