如何解决nni实验开始后卡住的问题怎么解决?
我通过以下方式创建了一个 nni 实验:
nnictl create --config config.yml
maxExecDuration: 12h
maxTrialNum: 500
#choice: local,remote,pai
trainingServicePlatform: local
searchSpacePath: search_space.json
#choice: true,false
useAnnotation: false
multiThread: true
logDir: "/path/of/logdir/"
tuner:
#choice: TPE,Random,Anneal,Evolution,BatchTuner,metisTuner,GPTuner
#SMAC (SMAC should be installed through nnictl)
builtinTunerName: TPE
classArgs:
#choice: maximize,minimize
optimize_mode: maximize
trial:
command: python main.py
codeDir: .
gpuNum: 3
localConfig:
gpuIndices: "1,2,3"
maxTrialNumPerGpu: 4
useActiveGpu: true
几分钟后,nni的web界面卡住了。 如果我刷新网络界面,它什么也不显示。
我想问题可能出在maxTrialNumPerGpu
上,因为我没有设置maxTrialNumPerGpu
就没有遇到这个问题。
有人可以帮我吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。