如何解决遍历扁平化2D Vec列的更有效方法
因此,我有一个Vec<bool>
存储在self.board.data
中,它代表一个2D网格。逐行迭代并在其索引和x,y坐标之间进行转换很容易,但是要逐列对其进行索引,我需要使用嵌套的for
循环。有没有更有效的方法可以做到这一点?我具有与此功能类似的功能,这些功能将运行 bunch 多次,因此我想使它们尽可能高效。
///returns average height of all columns
fn calc_avg_height(&self) -> f32 {
let mut heights = 0;
for x in 0..self.board.width {
for y in 0..self.board.height {
if self.board.data[(y*self.board.width)+x] {
heights+=self.board.height-y;
break
}
}
}
heights as f32/self.board.width as f32
}
解决方法
无论您做什么,逐列读取数据都将很慢,因为您将在内存中跳跃。与之相比,计算索引就是噪音。
有没有更有效的方法?
一个想法是将各个位放在一起以减少8个内存。另一个想法是逐列保留数据,仅在需要时进行更新(这取决于您的访问模式)。
,您可以预加载索引,以便只需要遍历它们。在时间上效率更高,但在空间上效率更高:
fn preload_indexes(row_size: usize,column_size: usize) -> Vec<usize> {
let mut indexes = Vec::new();
for x in 0..row_size {
for y in 0..column_size {
let i = y*row_size+x;
indexes.push(i);
}
}
indexes
}
作为完整示例:
use std::fmt::Display;
struct Matrix<T: Display> {
row_size: usize,column_size: usize,data: Vec<T>,columns_indexes: Vec<usize>,}
fn preload_indexes(row_size: usize,column_size: usize) -> Vec<usize> {
let mut indexes = Vec::new();
for x in 0..row_size {
for y in 0..column_size {
let i = y*row_size+x;
indexes.push(i);
}
}
indexes
}
impl<T: Display> Matrix<T> {
fn new(data: Vec<T>,row_size: usize,column_size: usize) -> Self {
assert_eq!(data.len(),row_size*column_size);
Self {
row_size,column_size,data,columns_indexes: preload_indexes(row_size,column_size),}
}
fn print_rows(&self) {
for e in self.data.iter() {
println!("{}",e);
}
}
fn print_columns(&self) {
for i in self.columns_indexes.iter() {
println!("{}",self.data[*i]);
}
}
}
fn main() {
let matrix = Matrix::new(vec![1,2,3,4],2);
println!("Rows");
matrix.print_rows();
println!("Columns");
matrix.print_columns();
}
,
围绕你的例子,我很惊讶地发现
索引计算(y*width+x
)似乎不是
由优化器简化。
而且,尽管我的内存访问更为重要
比删除索引计算中的乘法要好。
但是在计时方面,我可以看到很大的不同
(具有各种网格大小和正确/错误的初始化)。
修改
阅读下面的一些评论后,我比较了两个版本,
_v1
和_v2
,在编译器资源管理器(godbolt)中。
它们看起来非常相似,除了_v1
使用lea
指令和_v2
分别使用add
和inc
。
根据vtune-amplifier,_v1
的大部分时间是
花费在此确切的lea
指令上。
因此,至少在我的计算机上,以及在此特定示例中,以及
与直觉相反,选择lea
而不是add
和
inc
似乎比不定期的内存访问更有害
模式。
/*
$ rustc -C opt-level=3 prog.rs && ./prog
avg1=50.5
v1: 4453 ms
avg2=50.5
v2: 2361 ms
*/
pub struct Board {
width: usize,height: usize,data: Vec<bool>,}
impl Board {
pub fn new(
width: usize,) -> Self {
Self {
width,height,data: vec![false; width * height],}
}
pub fn calc_avg_height_v1(&self) -> f32 {
let mut heights = 0;
for x in 0..self.width {
for y in 0..self.height {
if self.data[(y * self.width) + x] {
heights += self.height - y;
break;
}
}
}
heights as f32 / self.width as f32
}
pub fn calc_avg_height_v2(&self) -> f32 {
let mut heights = 0;
for x in 0..self.width {
let mut idx = x;
for y in 0..self.height {
if self.data[idx] {
heights += self.height - y;
break;
}
idx += self.width;
}
}
heights as f32 / self.width as f32
}
}
pub fn run<F>(
name: &str,repeat: usize,fnct: F,) -> u128
where
F: Fn() -> f32,{
let mut prev = -1.0_f32;
let warmup = repeat / 10;
for _ in 0..warmup {
let avg = fnct();
if avg != prev {
println!("{}={}",name,avg);
prev = avg;
}
}
let now = std::time::Instant::now();
for _ in 0..repeat {
let avg = fnct();
if avg != prev {
println!("{}={}",avg);
prev = avg;
}
}
now.elapsed().as_millis()
}
pub fn main() {
let mut board = Board::new(100,100);
for y in 0..board.height {
for x in 0..board.width {
board.data[y * board.width + x] = x == y;
}
}
let repeat = 1_000_000;
println!(
" v1: {} ms",run("avg1",repeat,|| board.calc_avg_height_v1())
);
println!(
" v2: {} ms",run("avg2",|| board.calc_avg_height_v2())
);
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。