如何解决在没有超线程的情况下运行并行作业 Torque PBS 脚本
是否可以禁用超线程?或者通过扭矩 PBS 脚本的方式仅使用节点中可用的物理内核。
我的问题是,当我使用 node=1:ppn=12 运行 MPI 作业时,它运行速度很好。(第一次迭代需要不到 1 分钟)但是当我使用 node=2:ppn=12 时,速度很糟糕(第一次迭代需要 6 小时以上)
我的扭矩 PBS 作业脚本
#!/bin/bash
#PBS -N Vcrlx
#PBS -q batch
#PBS -l nodes=2:ppn=12
#PBS -l walltime=20:00:00
#PBS -m bea
#PBS -j oe
cd $PBS_O_WORKDIR
mpirun -np 24 pw.x < vcrlx.in > vcrlx.out
尝试过的解决方案
我通过电子邮件向他们发送了有关此超线程问题的电子邮件,但尚未收到回复(10 天)
因为我的代码 Quantum Espresso 可以与 MPI、OpenMP 和混合 MPI+OpenMP 一起运行。我尽我最大的努力去理解所有这些,但没有得到想要的结果。或者可能是因为我对这些事情的背景知识非常贫乏而误解了。
我尝试了很多像下面这样的组合,但没有一个奏效
#!/bin/bash
#PBS -N Vcrlx
#PBS -q batch
#PBS -l nodes=2:ppn=12::mpiprocs=1:ompthreads=24 <--------------
#PBS -l walltime=24:00:00
#PBS -m abe
#PBS -j oe
cd $PBS_O_WORKDIR
mpirun -np 24 pw.x < vcrlx.in > vcrlx.out
它的输出
Parallel version (MPI & OpenMP),running on 48 processor cores
Number of MPI processes: 24
Threads/MPI process: 2
MPI processes distributed on 2 nodes
R & G space division: proc/nbgrp/npool/nimage = 24
请帮助我在没有超线程的情况下运行作业。谢谢
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。