微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

无法在守护进程模式下运行 vvopal wabbit 上下文老虎机

如何解决无法在守护进程模式下运行 vvopal wabbit 上下文老虎机

我正在尝试以 --daemon 模式将我的数据流式传输到 vw。现在我只使用一个玩具示例。 由于某些原因,我没有使用大众拥有的任何策略(epsilon、bag,首先)。我总是得到一个错误。有什么问题吗?

我的数据:

9:0:0.3 | SmartPhone 1 16
7:0:0.3 | SmartPhone 1 21

我如何启动培训:

vw --cb 10 --epsilon 0.1 -d train.vw --save_resume -f model.vw

它给了我错误(同样的错误 --bag 10,--first 2,cb_explore 10--bag 10 btw):

PS C:\Users\Default.PC\Desktop\vw> vw -d train.vw --cb 10 --epsilon 0.1 -f model.vw
final_regressor = model.vw
Num weight bits = 18
learning rate = 0.5
initial_t = 0
power_t = 0.5
Error: unrecognised option '--epsilon'

但是,如果我不使用 --epsilon,代码就可以工作。

vw --cb 10 -d train.vw --save_resume -f model.vw

我可以用它进行预测:

predict: | SmartPhone 1 19 - result is 3

解决方法

不确定使用的是哪个 vw 版本,但带有 --epsilon 的命令似乎在 vw 8.9.2 上运行良好:

PS C:\Users\xxx\Desktop> vw --version
8.9.2 (git commit: 884420267)

PS C:\Users\xxx\Desktop> vw -d train.vw --cb 10 --epsilon 0.1 -f model.vw
final_regressor = model.vw
Num weight bits = 18
learning rate = 0.5
initial_t = 0
power_t = 0.5
using no cache
Reading datafile = train.vw
num sources = 1
Enabled reductions: gd,scorer,csoaa,cb
average  since         example        example  current  current  current
loss     last          counter         weight    label  predict features
0.000000 0.000000            1            1.0    known        1        4
0.000000 0.000000            2            2.0    known        1        4

finished run
number of examples = 2
weighted example sum = 2.000000
weighted label sum = 0.000000
average loss = 0.000000
total feature number = 8
,

我会尝试使用 --cb_explore 10 而不是 --cb 10,因为它允许使用探索算法。

可以在此处的教程中找到更多详细信息: https://vowpalwabbit.org/tutorials/contextual_bandits.html

--cb 上下文老虎机模块,允许您根据已收集的数据或无需探索的上下文老虎机优化预测器。

--cb_explore 上下文老虎机学习算法,用于提前知道最大动作数量并且动作的语义在所有示例中保持不变。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。