tensorflow-agents - 编程之家

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

tensorflow-agentstensorflow-agents专题提供tensorflow-agents的最新资讯内容，帮你更好的了解tensorflow-agents。

我正在尝试使用TF-Agent <a href="https://www.tensorflow.org/agents/tutorials/1_dqn_tutorial" rel="nofollow noreferrer">TF-Agent DQN

作者：佚名时间：2022-08-15

TF keras图层不再可保存？

最近升级到Tensorflow 2.3后，我无法保存TF-agents图层，我得到了： <pre><code>AttributeError: 'ActorDistribution

作者：佚名时间：2022-08-13

tf-agent，QNetwork => DqnAgent，带有tfa.optimizers.CyclicalLearningRate

是否有一种简单的本机方式来实现<a href="https://www.tensorflow.org/addons/api_docs/python/tfa/optimizers/CyclicalLearningRa

作者：佚名时间：2022-06-22

具有实际环境而不是python类环境的Tensorflow代理

根据<a href="https://en.wikipedia.org/wiki/Reinforcement_learning" rel="nofollow noreferrer">Wikipedia</a>关于强化学习 <block

作者：佚名时间：2022-06-11

我可以在TF代理中使用tf_driver代替dynamic_step_driver和dynamic_episode_driver吗？

在TF Agents的github仓库中，存在三个驱动程序类，用于使用tensorflow策略逐步进入tensorflow环境。前两个是<co

作者：佚名时间：2022-06-11

使用张量流代理和其他一般优化的深度q网络参数

我对<code>tensorflow-agents</code>和深入的Q学习有几个问题。它包含两个部分，可以任意回答。在<code>te

作者：佚名时间：2022-06-10

Tensorspec不匹配，自定义环境tensorflow

如果您能帮助我，我将不胜感激。我的自定义环境规范action_spec和observation_spec如下： <pre><code>self._act

作者：佚名时间：2022-06-08

在DqnAgent / tf_agents中，log_probability意味着什么

在tf_agents <a href="https://www.tensorflow.org/agents/api_docs/python/tf_agents/agents/DqnAgent" rel="nofollow noreferrer">DqnAgent doc

作者：佚名时间：2022-06-07

tf-agents 环境可以定义为不可观察的外生状态吗？

对于标题中的问题不是很清楚，我提前道歉。我正在尝试使用 tf-agents 训练强化学习策略，其中存在一些

作者：佚名时间：2022-05-30

在 tf-agents

我一直在尝试使用 tensorflow 中的 tf-agents 构建 rl 代理。我在自定义构建环境中遇到了这个问题，但使用

作者：佚名时间：2022-05-28

需要使用 tf-agents Ddpgagent 的完整示例

我找不到在 TensorFlow 中使用 tf-agents 中的 DdpgAgent 的任何完整示例

作者：佚名时间：2022-05-26

使用带有浮点*和整数*的gym.spaces.Tuple

当发现gym.spaces.Tuple时，我对混合连续值和离散值的观察空间的视角感到非常高兴。然而，我读到的关于

作者：佚名时间：2022-05-25

TF Agents 训练期间任何变量都没有梯度

我正在尝试强化学习并选择 <a href="https://play2048.co/" rel="nofollow noreferrer">2048 game</a> 开始。我遵循了 <a href

作者：佚名时间：2022-05-22

如何修复 TF-Agents 中 policy_state 和 policy_state_spec 之间的类型错误？

我正在开发一个 PPO 代理，它使用 TF-Agents 播放（嗯，应该）Doom。作为代理的输入，我试图给它一堆 4 张

作者：佚名时间：2022-05-17

合并和拆分来自 TF-agents 的时间和动作步骤

我正在尝试在一个简单的多智能体非合作并行游戏中使用 TF 智能体。为简化起见，我有两个代理，用 TF

作者：佚名时间：2022-05-16

TF-Agents 自定义环境应急行动

对仅在某些状态下允许的操作进行编码的惯用方法是什么？例如，您有四个操作： <ol> <li>翻转

作者：佚名时间：2022-04-28

在 TensorFlow 中根据状态限制 RL 动作空间

我通过 TF Agents 包感受到了软弱的演员评论家。我遇到了一个问题，即政策为环境应该建模的内容输出不

作者：佚名时间：2022-04-28

Tf-agents 环境示例中 _observation_spec 的形状和 _action_spec 的形状

在 <a href="https://colab.research.google.com/github/tensorflow/agents/blob/master/docs/tutorials/2_environments_tutorial.ipynb#scrollTo

作者：佚名时间：2022-04-28

绘制多臂强盗的奖励值

如何在具有 Per-Arm 特征的 Multi-Arm Bandits 上绘制此 <a href="https://www.tensorflow.org/agents/tutorials/per_arm_bandits_tut

作者：佚名时间：2022-04-24

为什么当我将 Cartpole 环境换成我自己的更简单的环境时，TensorFlow Agents 的内置 DQN 教程无法学习？

我正在尝试训练一个 DQN 代理，该代理几乎完全按照 TensorFlow 代理的 <a href="https://www.tensorflow.org/agents/tuto

作者：佚名时间：2022-04-24

小编推荐

苹果市值2025年有望达4万亿美元