微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python中的多元时空预测

如何解决Python中的多元时空预测

我不知道该在此处还是在Crossvalidated中发布此问题,但是我正在寻找用于多元时空预测的[python]库和工具,我已阅读trajectron++,但文档仍在它还处于起步阶段,所以我可能会以TL; DR为结尾。我也避免进入像RNN这样的深度学习方法和使用tensorflow方法,因为我想了解空间-时间预测,我一直在寻找基于statsmodels,scipy,numpy或sklearn的工具集。

我最初的方法是使用向量自动回归模型(VAR),但是我意识到将位置数据包含到模型中是一个坏主意,更不用说我需要每个省份都有一个单独的模型。因此,我采取了与各省一起使用增强型回归树[lightGBM]以及它们的长纬度作为变量的方法在这里,我假设回归树已经捕获了省级信息,并且不需要开发单独的模型(与为每个省开发不同的VAR模型相比)。但是我对使用回归树的方法表示怀疑:

  • 省列数据类型从“对象”转换为“类别”,并且该列中的每个唯一元素均按字母顺序排序,然后从字符串转换为整数。我不知道回归树将如何处理这些整数[将其视为离散整数还是将其本质上转换为虚拟变量?]
  • 将经纬度视为连续变量,并且与第一个问题相同,我不知道模型将如何考虑这些,因为知道经纬度本身不是数字行上的数字。
  • long-lat的另一个问题是树可能会考虑这两个独立变量:long,lat;而不是单个数据:(经纬度)。
  • 对于大于t + 1的任何层,基于树的回归性能往往不稳定。

但是没有基准模型可以依靠,我感觉就像是在水晶球领域一样。

提供给我的.shp数据具有以下标题

Island_group | province | Date | Long | Lat | Rice_demand | Pork_demand | Beef_demand | Chicken_demand | Sugar_demand | Infant_Milk_demand | Geometry | .

因此,基本上,它是对基本需求的多元时空预测形式,菲律宾有三大岛群,有81个省。数据集中几乎没有空值。数据类型如下:

Island-Group | string
province | string
Date | YYYY-MM-DD
long | float
lat | float
Rice_demand | float
Pork_demand | float
Beef_demand | float
Chicken_demand | float
Sugar_demand | float
Infant_Milk_demand | float

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。