如何解决机器学习目标列减少PySpark
我有一个用于多分类问题的目标列ActionName
。目标列具有4个唯一值。我将需要我的模型来预测ActionName
是0、1、2还是3。我看到我将在其上训练模型的历史数据中出现这些值的次数不同碰巧3
值是数据的52%,而其他三个值的百分比较小。如何减少目标列中以3
作为值的行数?我正在使用Sagemaker笔记本,并与PySpark一起运行。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。