如何解决对大型犰狳矩阵或向量进行子采样
我一直在浏览 Armadillo documentation 和示例,但似乎没有真正有效的方法来对大型向量或矩阵进行子采样(或重新采样),因此如果您最初有 N 个元素,则结束最多 N / k 个元素。有几种方法可以进行 shuffle 和 shift,但仅此而已。
所以我只是按顺序循环遍历所有元素,但除了对可用内核进行矢量化之外,肯定还有更好的方法吗?
bool subsample(config& cfg,arma::mat& data,int skippCount)
{
const auto processor_count = 1; // currently not using threading because 'inplace'
const size_t cols = data.n_cols;
const size_t period = skippCount + 1 ;
size_t newCols = cols / period;
newCols += (0 == (cols % period)) ? 0 : 1;
const size_t blockSize = 256;
std::vector<thread> workers;
for (size_t blockID = 0; blockID < newCols / blockSize; ++blockID) {
workers.push_back(std::thread([&data,blockID,newCols,period]() {
// copy blockSize elements inplace (overwrites other entries))
size_t c = blockID * blockSize;
for (size_t b = 0; (c < newCols) && (b < blockSize); c++,b++) {
arma::vec v = data.col(period * c);
data.col(c) = v;
}
}));
if (workers.size()==processor_count) {
for (auto& thread : workers) thread.join();
workers.clear();
}
}
for (auto& thread : workers) thread.join(); // make sure all threads finish
data.resize(data.n_rows,newCols);
return true;
}
如果您对此有任何改进建议,我们将不胜感激。此外,最好在“就地”执行此操作以节省内存。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。