微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

默认情况下始终标准化所有功能是不是一个坏主意?

如何解决默认情况下始终标准化所有功能是不是一个坏主意?

认情况下是否有理由不对所有功能进行标准化?我意识到它可能不是必要的,例如决策树,而是某些算法,如 KNN、SVM 和 K-Means。对我的所有功能进行常规操作会有什么危害吗?

此外,似乎一致认为标准化优于规范化?什么时候这不是一个好主意?

解决方法

根据我的经验,当您的数据集由具有非常不同范围的特征(例如年龄与每所房子的美元数)组成时,标准化和标准化具有最大的(积极)影响

根据我的专业经验,在使用汽车传感器进行项目时,我注意到归一化(最小-最大缩放),即使应用于神经网络,也会对训练过程产生负面影响,并且当然是最后的结果。诚然,传感器特征(值)彼此之间的值是否非常接近。考虑到我正在研究时间序列,这是一个非常有趣的结果,其中大多数数据科学家默认采用缩放(他们最终是神经网络,遵循理论)。

原则上,当涉及到数据集中的特定异常值时,最好应用标准化,因为标准化会产生较小的标准偏差值。以我的拙见,这就是标准化往往比标准化更受青睐的主要原因,它的稳健性优于异常值。

三年前,如果有人问我这个问题,我会说“标准化”是必经之路。现在我要说,遵循原则,但在得出某个结论之前先检验每个假设。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。