python用opencv读取图像如何做格式转换
python用opencv读取图像如何做格式转换
在python中用cv2读取图像文件或摄像头,都能获取一帧图像,如
import cv2
frame1 = cv2.imread(“a.jpg”)
cap = cv2.VideoCapture(0)
rval, frame2 = cap.read()
上面获得的frame1和frame2都是numpy array格式的。但是有时候我们想要把它转成自己的格式,比如有时候可能需要调用C++函数,比如在darknet中,这时就要进行格式转换。这个方法有如下几种:
-
存成文件,再用相应的读文件方法读取
这种方法这里不谈,毕竟频繁地读写文件的方法在很多场合下是不可取的,其实速度还可以,但仍然不是一种完美的方式。 -
直接在python中做格式转换
既然知道frame是numpy array格式,当然可以直接做转换,但是在python中进行这种操作非常耗时。笔者测试了一下,转换一张416x416x3的图像大约需要3秒钟。这个速度甚至不如用文件转存的方式。 -
本文重点要说的,是通过C函数进行转换
首先,从numpy array获得C数据指针:
h,w,c=frame1.shape
if not frame1.flags[‘C_CONTIGUOUS’]:
frame1= np.ascontiguousarray(frame1, dtype=frame1.dtype) # 转换成连续存放
data_ptr = cast(frame1.ctypes.data, c_char_p)这个data_ptr 就是所要传递给C函数的数据指针,此外还得到了图像高度h,宽度w和通道数c。
下面要做的,是在python中声明一个自己定义的C函数mat2local_image,比如在darknet中:
lib = CDLL(“libdarknet.so”, RTLD_GLOBAL)
mat2local_image = lib.mat2local_image
mat2local_image.argtypes = [c_int,c_int,c_int,c_char_p]
mat2local_image.restype = IMAGE其中IMAGE是自己定义的数据格式,比如在darknet中是这样定义的:
class IMAGE(Structure):
fields = [(“w”, c_int),
(“h”, c_int),
(“c”, c_int),
(“data”, POINTER(c_float))]此外,你还要在C文件中定义一个C函数mat2local_image,例如在darknet中:
image mat2local_image(int w, int h, int c, unsigned char *data)
{
int i, j, k;
image im = make_image(w, h, c);
for(i = 0; i < h; ++i){
for(k= 0; k < c; ++k){
for(j = 0; j < w; ++j){//data is BGR, so c-k-1 to reverse to RGB
im.data[k*w*h + i*w + j] = data[i*w*c + j*c + c-k-1]/255.;
}
}
}
//It has been reversed to RGB
//rgbgr_image(im);
return im;
}注意,因为cv2读图像的格式是BGR,所以在转换时,需要将R,B交换。在这个函数中,我们直接通过c-k-1进行这个交换,而不需要调用rgbgr_image函数。然后把C文件编译成.so。
现在,你可以在python中调用这个函数了:
def image_mat2local(image_mat):
h,w,c=frame1.shape
if not frame1.flags[‘C_CONTIGUOUS’]:
frame1= np.ascontiguousarray(frame1, dtype=frame1.dtype) # 转换成连续存放
data_ptr = cast(frame1.ctypes.data, c_char_p)
im = mat2local_image(w,h,c,data_ptr)
return im
请关注爱在上工: