无法在守护进程模式下运行 vvopal wabbit 上下文老虎机

如何解决无法在守护进程模式下运行 vvopal wabbit 上下文老虎机

我正在尝试以 --daemon 模式将我的数据流式传输到 vw。现在我只使用一个玩具示例。由于某些原因，我没有使用大众拥有的任何策略（epsilon、bag，首先）。我总是得到一个错误。有什么问题吗？

我的数据：

9:0:0.3 | SmartPhone 1 16
7:0:0.3 | SmartPhone 1 21

我如何启动培训：

vw --cb 10 --epsilon 0.1 -d train.vw --save_resume -f model.vw

它给了我错误（同样的错误 --bag 10,--first 2,cb_explore 10--bag 10 btw）：

PS C:\Users\Default.PC\Desktop\vw> vw -d train.vw --cb 10 --epsilon 0.1 -f model.vw
final_regressor = model.vw
Num weight bits = 18
learning rate = 0.5
initial_t = 0
power_t = 0.5
Error: unrecognised option '--epsilon'

但是，如果我不使用 --epsilon，代码就可以工作。

vw --cb 10 -d train.vw --save_resume -f model.vw

我可以用它进行预测：

predict: | SmartPhone 1 19 - result is 3

解决方法

不确定使用的是哪个 vw 版本，但带有 --epsilon 的命令似乎在 vw 8.9.2 上运行良好：

PS C:\Users\xxx\Desktop> vw --version
8.9.2 (git commit: 884420267)

PS C:\Users\xxx\Desktop> vw -d train.vw --cb 10 --epsilon 0.1 -f model.vw
final_regressor = model.vw
Num weight bits = 18
learning rate = 0.5
initial_t = 0
power_t = 0.5
using no cache
Reading datafile = train.vw
num sources = 1
Enabled reductions: gd,scorer,csoaa,cb
average  since         example        example  current  current  current
loss     last          counter         weight    label  predict features
0.000000 0.000000            1            1.0    known        1        4
0.000000 0.000000            2            2.0    known        1        4

finished run
number of examples = 2
weighted example sum = 2.000000
weighted label sum = 0.000000
average loss = 0.000000
total feature number = 8

我会尝试使用 --cb_explore 10 而不是 --cb 10，因为它允许使用探索算法。

可以在此处的教程中找到更多详细信息： https://vowpalwabbit.org/tutorials/contextual_bandits.html

--cb 上下文老虎机模块，允许您根据已收集的数据或无需探索的上下文老虎机优化预测器。

--cb_explore 上下文老虎机学习算法，用于提前知道最大动作数量并且动作的语义在所有示例中保持不变。