如何解决推荐的方法来训练自动编码器上的时间序列数据
我想训练飞机系统的时间序列上的自动编码器,以便能够识别特定系统的模式何时显示异常(即:实际模式将“显着”偏离重构信号)。 我对于两种预处理和训练模型的方法不满意,我想参考您的集体智慧和经验来指导我。每个列都是特定系统不同航班的时间戳记集合。 由于飞机A的System1与飞机B的System1完全独立,因此我不能简单地通过将“ sequence_lenght”的片段分批组合并将其馈送到网络来以“常规方式”馈送先前的数据集。只要我从同一架飞机上读取数据,该功能便会起作用,但是一旦我切换飞机,就没有连续性。
方法1:增量培训 我会一次只使用一架飞机的数据以“常规方式”训练模型。在每次迭代中,我将继续训练相同的模型,但使用不同的飞机进行不同的批次训练。 每次迭代(希望)在前一个迭代的基础上有所改进。
优点:这是预处理方面的“简便”方法+我可以利用记忆效应来识别更长的模式(使用RNN或LSTM层)…。
缺点:…只要系统不尝试查找来自不同飞机的批次中的模式,情况是否如此?
方法2:“心电图方式” 这是受ECG数据集启发的。我可以不考虑长期飞行,而不是将数据集视为一个重要的时间序列流。 在这种情况下,我将重新采样每个航班,使其长度相同。然后,该模型将通过查看一系列独立飞行来训练模型,以识别飞行中出了什么问题,而实际的时间顺序(两次飞行之间)将不再重要。这样我就可以训练所有数据集。
专家:简化培训+“ sequence_lenght”等同于飞行时长,因此使用起来更容易。
缺点:重采样可能会导致压缩和信息丢失+通过假设每个航班彼此独立,我可以防止系统查找出现在多个航班上的较长时间模式。
当然,一个简单的答案是“尝试一下,自己看看”,而我会完全坚持下去,因为时间和资源都不是约束。
您对我应该首先尝试的内容有任何经验或建议吗?
感谢您的帮助,
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。