微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

防止超体积计算进入 R 中的负特征空间

如何解决防止超体积计算进入 R 中的负特征空间

我目前正在使用 R (V. 4.0.2) 中的“超体积”包,根据四个连续的功能性状(植物高度、叶长、花长和果实长度)计算植物群的高斯 KDE 超体积。

因此,我在分析之前对特征数据进行了集中和缩放。我正在分析的四个特征的值的分布是右偏的,因此是非正态分布的。我没有对特征数据进行对数转换,因为极值对我的分析很重要,不应受到转换的限制。

对于实际的高斯 KDE 超体积计算,我决定使用 0.5 的固定带宽,因为这最能代表大多数方向上观察到的数据的超体积。

hv_list <- hypervolume_gaussian(data,samples.per.point = 100,kde.bandwidth = 0.5,verbose = FALSE)

plot(hv_list,random.points = FALSE,centroid = FALSE)

在这里是超体积计算的问题:超体积的估计似乎适合更大的特征值。然而,超体积也被估计到负性状空间中,即随机点估计在自然界中不会出现的值,如负植物高度(见下图中的箭头)。

Gaussian KDE hypervolume of two traits. The arrow points at the hypervolume estimation of negative trait space

我尝试过 SVM 超体积计算,但这里也出现了负超体积的问题。此外,我对特征数据进行了 PCA 以尝试对数据的分布进行归一化。这有效,但我更喜欢使用原始特征作为超体积计算的输入变量。 此外,我尝试修剪/定义一个阈值,以切断负面特征值估计区域中的超体积。这不起作用,因为数据的偏度使超体积的质心接近于零。因此,严格的阈值会高度低估朝向更高特征值的超量。

我向社区提出的问题是:是否有可能以某种方式切断特征值负端的超容量?或者是否有可能从一开始就阻止将超体积计算到负特征空间中?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。