如何解决OpenCL中的图像灰度
我想将RGB图像转换为灰度图像。
我的问题是当我将数据复制回内核时返回零。
OpenCL代码:
__kernel void grayscale(__global uchar * input,__global uchar * output)
{
int gid = get_global_id(0);
output[gid] = 0.0722 * input[gid][0] + 0.7152 * input[gid][1] + 0.2126 * input[gid][2];
}
主机代码:
void RunKernel(char fileName[],char methodName[],Mat inputImg,Mat outputImg,char outputLoc[],int mem_size){
/*
Initialisation of the device and read the kernel source.
*/
//Creating cl_mem objects for input and output. men_size is the image width*height
imgInMem = clCreateBuffer(img_context,CL_MEM_READ_ONLY,mem_size * sizeof(uchar),NULL,&err);
imgOutMem = clCreateBuffer(img_context,CL_MEM_WRITE_ONLY,&err);
//copy the data into cl_mem input
err = clEnqueueWriteBuffer(img_cmd_queue,imgInMem,CL_TRUE,mem_size *sizeof(uchar),&inputImg.data,NULL);
//Create the program and load the kernel source to it
img_program = clCreateProgramWithSource(img_context,1,(const char **) &kernel_src_str,(const size_t *) &kernel_size,&err);
err = clBuildProgram(img_program,&dev_id,NULL);
img_kernel = clCreateKernel(img_program,methodName,&err);
//Setting the kernel args
err = clSetKernelArg(img_kernel,sizeof(cl_mem),(void *) &imgInMem);
err = clSetKernelArg(img_kernel,(void *) &imgOutMem);
//define the global size and local size
size_t global_work_size = mem_size;
size_t local_work_size = 256;
//Enqueue a command to execute a kernel on a device ("1" indicates 1-dim work)
err = clEnqueueNDRangeKernel(img_cmd_queue,img_kernel,&global_work_size,&local_work_size,NULL);
err = clFinish(img_cmd_queue);
//Read back the result from device
err = clEnqueueReadBuffer(img_cmd_queue,imgOutMem,outputImg.data,NULL);
/*
Release the necessary objects.
*/
}
在clEnqueueReadBuffer
之后,如果我将值写入控制台,则全为零。我的outputImg在main
中这样声明:
Mat outImg(height,width,CV_8UC1,Scalar(0));
并以此调用方法:
RunKernel("kernels/grayscale.cl","grayscale",inImg,outImg,"resources/grayscale_car_gpu.jpg",MEM_SIZE);
解决方法
问题很可能是您使用的2D数组语法:
0.0722 * input[gid][0] + 0.7152 * input[gid][1] + 0.2126 * input[gid][2]
您认为哪些地址可以访问?
相反,假设您尝试将连续字节作为RGB访问(以BGR顺序,根据系数值判断),请尝试:
0.0722 * input[3*gid+0] + 0.7152 * input[3*gid+1] + 0.2126 * input[3*gid+2]
您应该在浮点常量中添加“ f”(否则它们是double值,并非所有设备都支持)。
您应该将float从四舍五入添加到uchar。所以,总的来说,像这样:
convert_uchar_sat_rte(0.0722f * input[3*gid+0] +
0.7152f * input[3*gid+1] +
0.2126f * input[3*gid+2])
最后,您将为输入和输出图像传递相同大小的缓冲区,但似乎将输入缓冲区视为RGB,它比单色的单个字节大3倍。因此,您需要在主机代码中对其进行修复。
每当您从内核获得不正确的输出时,请将其简化以查看它是输入问题,计算问题,输出问题还是主机成本问题。不断缩小范围,直到发现问题为止。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。