如何解决VectorAssembler - 更多组合
我正在准备特征来训练模型以预测给定前 5 个值的值,数据目前如下所示:
id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ...
a 150 110 130 80 136 150 190 110 150 110 130 136 100 150 190 110
b 100 100 130 100 136 100 160 230 122 130 15 200 100 100 136 100
c 130 122 140 140 122 130 15 200 100 100 130 100 136 100 160 230
使用 PySpark,我知道我必须使用 VectorAssembler
来准备功能,并且我会执行类似 VectorAssembler(inputCols=data[1:5],outputCol="features")
的操作。问题是,当我还可以对列 2:7、3:8、4:9 等组合进行训练时,我只会在 1-6 列上进行训练。我将如何组合这些向量以包含 6 个值的每个可能窗口?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。