如何解决内核中的 OpenCL 分析功能
据我所知,内核可以通过 opencl 分析 API 进行分析。所以我只是获得了内核级的性能。但是如果内核调用其他函数,我如何获得这个被调用者的分析。
静态 B {
}
内核 A {
B();
}
解决方法
使用函数调用和注释掉的函数调用来分析内核。减去执行时间。但是请注意编译器不会清空内核(禁用编译器优化),以防没有结果写入全局内存。还要注意时间测量误差和不确定性,如果函数调用比内核执行的其余部分花费的时间少;重复并平均时间测量以获得更准确的结果。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。