微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

由于计算导致的相等/错误的特征值的统计比较

如何解决由于计算导致的相等/错误的特征值的统计比较

我有一个机器学习管道,我们在其中获取一些时间序列数据,进行一些预处理,将其划分为多个窗口并计算一些统计和领域相关的特征。早些时候我们在 MATLAB 中有我们的代码,但由于部署问题不得不转移到 python。所以我们在 python 中实现了我们的代码,但我们发现计算的特征(特征矩阵 nxm,其中 n=数据窗口,m=计算特征的数量)与 Matlab 输出相比(按列)有点不同。那么问题来了,

单独比较每个特征列的正确度量/指标是什么,以便它给出列之间的相等性/相似性或误差的度量。

我尝试使用均方根误差 (RMSE) 和平均绝对误差 (MAE)。但是由于特征列的范围不同,到达阈值是令人困惑的。相关性也是一个很好的衡量标准。

请提供指向此类指标的指导

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。