如何解决OMP并行化fortran程序的指针/副本的注意事项是什么
我正在处理一个与OMP并行化的大型程序,在并行化的多个地方,我必须在使用指针或数据数组副本之间做出选择。我有一种直觉,认为选择可能会影响计算时间,但我不确定。在下面给出的示例程序中,我无法分辨出差异。
编译为:
$(document).ready(function(){
$('.clicker').click(function(){
$(this).parent().find('.click').toggle();
});
});
运行方式:
gfortran paralleltest.f90 -fopenmp
鉴于此示例,我想知道一些问题:
- 一般来说,人们希望看到这种说法中使用的指针和副本之间没有区别吗?
- 在什么情况下(如果有的话)会导致两者之间的显着差异(假设副本的内存开销不是问题)。 我是否以正确的方式衡量了这种性能差异?如果不是,那么衡量性能的更好方法是什么?
这是fortran文件:
>>> ./a.out 8 10000000
Copies (s): 0.835768998
results: 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032
Pointers (s): 0.837329030
results: 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032 8415334.9722864032
解决方法
代码不符合有两个原因:
-
value
中的函数结果aggregate_data
在被引用之前未定义。 -
在主程序中,由于第一个实际值,
x
元素的指针组件pointers
在传递给aggregate_data
过程时具有未定义的指针关联状态associate_pointer
的调用中没有TARGET属性的实参。
(您可以使用具有TARGET属性的伪参数调用过程,该伪参数具有TARGET属性,而相应的实际参数则没有,但在这样做时,将与伪参数关联的指针(例如{{1内的ptr
}})在执行过程完成后变得不确定。)
可以通过为主程序中的associate_pointer
变量赋予TARGET属性,并在parent
中的循环之前粘贴适当的赋值语句来纠正程序中的错误。
除了正确性之外,两个循环之间的 only 差异还存在于传递给aggregate_data
的实际参数中-一个循环传递了由可分配组件指定的数组,一个循环传递一个由指针组件指定的数组。该过程将该数组参数作为没有CONTIGUOUS的假定形状数组虚拟参数-给定形状数组的典型实现,编译器无需执行任何其他传递指针与可分配指针的操作。
(如果aggregate_data的dummy参数是显式或隐式连续的,则编译器可能需要在调用之前复制指针数组,因为指针可以与非连续的数组关联。可分配的数组始终是连续的。 )
两个循环都将其结果写入与实际参数成分不同类型的非目标可分配数组-因此,赋值语句中不会出现任何别名。
在循环中都没有修改任何实际参数,因此与在不同迭代中指定同一数组的指针参数相关联的潜在别名问题无济于事(从编译器的角度来看,这是保证的首要任务)程序员-不必在意)。
全部,我希望两个循环会发出相同的机器指令。同样的时机也不足为奇。
如果在循环中完成不同的工作-如果出现混叠或连续性,结果可能会有所不同。
方法的不同之处在于设置可分配数组组件参数所需的数据复制。但这(有意吗?)超出了时间安排。
从Fortran 2003开始(此代码要求)开始,除非需要引用语义,否则不要使用POINTER。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。