由于计算导致的相等/错误的特征值的统计比较

如何解决由于计算导致的相等/错误的特征值的统计比较

我有一个机器学习管道，我们在其中获取一些时间序列数据，进行一些预处理，将其划分为多个窗口并计算一些统计和领域相关的特征。早些时候我们在 MATLAB 中有我们的代码，但由于部署问题不得不转移到 python。所以我们在 python 中实现了我们的代码，但我们发现计算的特征（特征矩阵 nxm，其中 n=数据窗口，m=计算特征的数量）与 Matlab 输出相比（按列）有点不同。那么问题来了，

单独比较每个特征列的正确度量/指标是什么，以便它给出列之间的相等性/相似性或误差的度量。

我尝试使用均方根误差 (RMSE) 和平均绝对误差 (MAE)。但是由于特征列的范围不同，到达阈值是令人困惑的。相关性也是一个很好的衡量标准。

请提供指向此类指标的指导