OpenCL中的图像灰度

如何解决OpenCL中的图像灰度

我想将RGB图像转换为灰度图像。

我的问题是当我将数据复制回内核时返回零。

OpenCL代码：

__kernel void grayscale(__global  uchar *  input,__global  uchar *  output)
{
    int gid = get_global_id(0);

    output[gid] =  0.0722 * input[gid][0] + 0.7152 * input[gid][1] + 0.2126 * input[gid][2];
}

主机代码：

void RunKernel(char fileName[],char methodName[],Mat inputImg,Mat outputImg,char outputLoc[],int mem_size){
/*
 Initialisation of the device and read the kernel source.
*/
    //Creating cl_mem objects for input and output. men_size is the image width*height
        imgInMem = clCreateBuffer(img_context,CL_MEM_READ_ONLY,mem_size * sizeof(uchar),NULL,&err);
        imgOutMem = clCreateBuffer(img_context,CL_MEM_WRITE_ONLY,&err);
    //copy the data into cl_mem input
        err = clEnqueueWriteBuffer(img_cmd_queue,imgInMem,CL_TRUE,mem_size *sizeof(uchar),&inputImg.data,NULL);

    //Create the program and load the kernel source to it
        img_program = clCreateProgramWithSource(img_context,1,(const char **) &kernel_src_str,(const size_t *) &kernel_size,&err);

        err = clBuildProgram(img_program,&dev_id,NULL);

        img_kernel = clCreateKernel(img_program,methodName,&err);

    //Setting the kernel args
        err = clSetKernelArg(img_kernel,sizeof(cl_mem),(void *) &imgInMem);
        err = clSetKernelArg(img_kernel,(void *) &imgOutMem);

    //define the global size and local size
        size_t global_work_size = mem_size;
        size_t local_work_size = 256;

    //Enqueue a command to execute a kernel on a device ("1" indicates 1-dim work)
        err = clEnqueueNDRangeKernel(img_cmd_queue,img_kernel,&global_work_size,&local_work_size,NULL);

        err = clFinish(img_cmd_queue);

    //Read back the result from device
        err = clEnqueueReadBuffer(img_cmd_queue,imgOutMem,outputImg.data,NULL);
/*
   Release the necessary objects.
*/
}

在clEnqueueReadBuffer之后，如果我将值写入控制台，则全为零。我的outputImg在main中这样声明：

Mat outImg(height,width,CV_8UC1,Scalar(0));

并以此调用方法：

RunKernel("kernels/grayscale.cl","grayscale",inImg,outImg,"resources/grayscale_car_gpu.jpg",MEM_SIZE);

解决方法

问题很可能是您使用的2D数组语法：

0.0722 * input[gid][0] + 0.7152 * input[gid][1] + 0.2126 * input[gid][2]

您认为哪些地址可以访问？

相反，假设您尝试将连续字节作为RGB访问（以BGR顺序，根据系数值判断），请尝试：

0.0722 * input[3*gid+0] + 0.7152 * input[3*gid+1] + 0.2126 * input[3*gid+2]

您应该在浮点常量中添加“ f”（否则它们是double值，并非所有设备都支持）。

您应该将float从四舍五入添加到uchar。所以，总的来说，像这样：

convert_uchar_sat_rte(0.0722f * input[3*gid+0] + 
                      0.7152f * input[3*gid+1] + 
                      0.2126f * input[3*gid+2])

最后，您将为输入和输出图像传递相同大小的缓冲区，但似乎将输入缓冲区视为RGB，它比单色的单个字节大3倍。因此，您需要在主机代码中对其进行修复。

每当您从内核获得不正确的输出时，请将其简化以查看它是输入问题，计算问题，输出问题还是主机成本问题。不断缩小范围，直到发现问题为止。

OpenCL中的图像灰度

如何解决OpenCL中的图像灰度

解决方法

相关推荐