我试图建立一个基于CentOS的网格集群.所有的机器都有一些类似的结构(有些处理器比其他机器多),我只需要将作业推送到队列然后在可用节点上运行.每个CPU一个工作,其余工作等待.
John T has been exceptionally helpful指向我Gnu Queue接缝是我所假装的(工作将基本上是浴脚本).在接受他的回答之前我还在研究这个问题,但是我要求社区提供一些反馈,因为Gnu Queue网站接缝表明该项目已经死了好几年了.
我也看了Sun Grid Engine,它也像工作的候选人一样,不幸的是甲骨文现在正在杀死这个项目,而Univa还没有发布他们的端口.
我只想从右脚开始,所以我的问题是,你有这种聚类(网格计算)的任何实际经验.你的推荐是什么?
先感谢您.
如果您不需要真正的排队系统,GNU parallel可能足以同时在每个系统上启动作业.如果确实需要真正的调度程序,则可能需要
TORQUE Resource Manager和可选的调度程序,如
Maui.
你也可以放弃使用CentOS,转而使用像PelicanHPC这样的Live CD.至少那时,配置会更简单(至少它可以做什么).假设你在某个类型的大学里,那里根本没有人做过HPC和/或聚类?没有教师可以在国家实验室或类似工厂与您的项目提供CPU时间吗?
这个问题可能是迁移到Serverfault的候选者.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。