手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
tensorflow-agents
tensorflow-agents专题提供tensorflow-agents的最新资讯内容,帮你更好的了解tensorflow-agents。
tf.agent策略可以返回所有操作的概率向量吗?
我正在尝试使用TF-Agent <a href="https://www.tensorflow.org/agents/tutorials/1_dqn_tutorial" rel="nofollow noreferrer">TF-Agent DQN
作者:佚名 时间:2022-08-15
TF keras图层不再可保存?
最近升级到Tensorflow 2.3后,我无法保存TF-agents图层,我得到了: <pre><code>AttributeError: 'ActorDistribution
作者:佚名 时间:2022-08-13
tf-agent,QNetwork => DqnAgent,带有tfa.optimizers.CyclicalLearningRate
是否有一种简单的本机方式来实现<a href="https://www.tensorflow.org/addons/api_docs/python/tfa/optimizers/CyclicalLearningRa
作者:佚名 时间:2022-06-22
具有实际环境而不是python类环境的Tensorflow代理
根据<a href="https://en.wikipedia.org/wiki/Reinforcement_learning" rel="nofollow noreferrer">Wikipedia</a>关于强化学习 <block
作者:佚名 时间:2022-06-11
我可以在TF代理中使用tf_driver代替dynamic_step_driver和dynamic_episode_driver吗?
在TF Agents的github仓库中,存在三个驱动程序类,用于使用tensorflow策略逐步进入tensorflow环境。前两个是<co
作者:佚名 时间:2022-06-11
使用张量流代理和其他一般优化的深度q网络参数
我对<code>tensorflow-agents</code>和深入的Q学习有几个问题。它包含两个部分,可以任意回答。 在<code>te
作者:佚名 时间:2022-06-10
Tensorspec不匹配,自定义环境tensorflow
如果您能帮助我,我将不胜感激。 我的自定义环境规范action_spec和observation_spec如下: <pre><code>self._act
作者:佚名 时间:2022-06-08
在DqnAgent / tf_agents中,log_probability意味着什么
在tf_agents <a href="https://www.tensorflow.org/agents/api_docs/python/tf_agents/agents/DqnAgent" rel="nofollow noreferrer">DqnAgent doc
作者:佚名 时间:2022-06-07
tf-agents 环境可以定义为不可观察的外生状态吗?
对于标题中的问题不是很清楚,我提前道歉。我正在尝试使用 tf-agents 训练强化学习策略,其中存在一些
作者:佚名 时间:2022-05-30
在 tf-agents
我一直在尝试使用 tensorflow 中的 tf-agents 构建 rl 代理。我在自定义构建环境中遇到了这个问题,但使用
作者:佚名 时间:2022-05-28
需要使用 tf-agents Ddpgagent 的完整示例
我找不到在 <strong>TensorFlow</strong> 中使用 <strong>tf-agents</strong> 中的 <strong>DdpgAgent</strong> 的任何完整示例
作者:佚名 时间:2022-05-26
使用带有浮点*和整数*的gym.spaces.Tuple
当发现gym.spaces.Tuple时,我对混合连续值和离散值的观察空间的视角感到非常高兴。然而,我读到的关于
作者:佚名 时间:2022-05-25
TF Agents 训练期间任何变量都没有梯度
我正在尝试强化学习并选择 <a href="https://play2048.co/" rel="nofollow noreferrer">2048 game</a> 开始。我遵循了 <a href
作者:佚名 时间:2022-05-22
如何修复 TF-Agents 中 policy_state 和 policy_state_spec 之间的类型错误?
我正在开发一个 PPO 代理,它使用 TF-Agents 播放(嗯,应该)Doom。作为代理的输入,我试图给它一堆 4 张
作者:佚名 时间:2022-05-17
合并和拆分来自 TF-agents 的时间和动作步骤
我正在尝试在一个简单的多智能体非合作并行游戏中使用 TF 智能体。为简化起见,我有两个代理,用 TF
作者:佚名 时间:2022-05-16
TF-Agents 自定义环境应急行动
对仅在某些状态下允许的操作进行编码的惯用方法是什么? 例如,您有四个操作: <ol> <li>翻转
作者:佚名 时间:2022-04-28
在 TensorFlow 中根据状态限制 RL 动作空间
我通过 TF Agents 包感受到了软弱的演员评论家。我遇到了一个问题,即政策为环境应该建模的内容输出不
作者:佚名 时间:2022-04-28
Tf-agents 环境示例中 _observation_spec 的形状和 _action_spec 的形状
在 <a href="https://colab.research.google.com/github/tensorflow/agents/blob/master/docs/tutorials/2_environments_tutorial.ipynb#scrollTo
作者:佚名 时间:2022-04-28
绘制多臂强盗的奖励值
如何在具有 Per-Arm 特征的 Multi-Arm Bandits 上绘制此 <a href="https://www.tensorflow.org/agents/tutorials/per_arm_bandits_tut
作者:佚名 时间:2022-04-24
为什么当我将 Cartpole 环境换成我自己的更简单的环境时,TensorFlow Agents 的内置 DQN 教程无法学习?
我正在尝试训练一个 DQN 代理,该代理几乎完全按照 TensorFlow 代理的 <a href="https://www.tensorflow.org/agents/tuto
作者:佚名 时间:2022-04-24
上一页
1
2
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 三星当前最强PC SSD“PM9E1”启动量产,
• 向智能家居迈进!苹果2025年将发布home
• 中国平板市场大洗牌 为什么华为能够力压
• iFixit拆解苹果AirPods 4耳机:仍是“维
• 英伟达RTX 5090笔记本显卡曝光:24GB G
• 平台惊现英伟达GeForce RTX GT610!竟已
• 联想ThinkBook 16+ 2025锐龙AI 9 365版
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot