如何解决为什么在加载检查点以测试模型后立即得到“完成”?
我从执行中得到什么,我打印[完成,奖励]:
当我尝试实施td3文件时,遇到了上述问题。保存模型并加载以进行测试后,它会将下一步变为“完成”步骤,从而中断了以后的培训。它结束了情节。有人可以帮我吗?
las vegas,nv|36.17497|-115.13722
homestead,pa|40.4059|-79.91199
streetsboro,oh|41.23922|-81.34594
for episode in range(1,self.hyperparamDict['maxEpisode']+1):
obs = env.reset()
epsReward = 0
episodeestimate = 0
for i in range(self.hyperparamDict['maxTimeStep']):
isdone = False
#env.render()
act = agent.choose_action(obs,env.action_space.low,env.action_space.high)
new_state,reward,isdone,info = env.step(act)
agent.remember(obs,act,new_state,int(isdone))
print(isdone,reward)
agent.learn()
epsReward += reward
obs = new_state
agent.runtime +=1
if agent.runtime %1e02 == 0 :
agent.save_models()
# it interrupts training
actualQ,predictedQ = getddpgModelEvalResult(env,self.hyperparamDict,numTrajToSample = 10)
actualreward.append(actualQ)
predictreward.append(predictedQ)
if isdone:
break
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。