如何解决HPC-PBS后台提交的工作报告
我曾经在后台运行HPC-PBS作业,每个节点有1个节点,使用./a&到10个核心,分别位于不同文件夹中。脚本的主要部分是
for j in {1..10..1};
do
cd $j
icc -o a Code.c;./a&
cd ..
done
现在,由于代码很大且容易出错,因此某些后台作业会停止,而其他后台作业会平稳运行。在单独检查每个文件夹之前,我没有收到有关这10个基础作业的信息。PBS仅对所有10个作业返回一个作业ID,并在所有作业完成后返回退出状态。 是否可以以某种方式直接检查哪个后台线程已停止并从同一脚本重新启动,或者可能是其他链接的脚本?
注意:我是用户,因此不能使用“ sudo”。 “顶部”也没有意义。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。