如何解决google ai 平台上的超参数调整错误:“副本主 0 以非零状态 1 退出”
在谷歌云 AI 平台训练深度学习模型时,使用超参数调优(我的超参数配置信息在 YAML 文件中),我收到此错误:
Hyperparameter Tuning Trial #2 Failed before any other successful trials were completed.
The Failed trial had parameters: batch_size=11,learning_rate=3.527059074944887e-05,.
The trial's error message was: The replica master 0 exited with a non-zero status of 1
由于错误消息有点笼统,我很难理解问题出在哪里。
我的 YAML 配置文件:
trainingInput:
hyperparameters:
goal: MINIMIZE
maxTrials: 2
maxParallelTrials: 2
hyperparameterMetricTag: loss
enableTrialEarlyStopping: FALSE
params:
- parameterName: batch_size
type: INTEGER
minValue: 8
maxValue: 16
scaleType: UNIT_LINEAR_SCALE
- parameterName: learning_rate
type: DOUBLE
minValue: 0.00001
maxValue: 0.0001
scaleType: UNIT_LINEAR_SCALE
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。