微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何以更好的优化方式计算 cross_val_score() 的平均值?

如何解决如何以更好的优化方式计算 cross_val_score() 的平均值?

为了训练,我使用了一个包含 13 个特征和 304 行的样本数据。我正在尝试评估我使用的 RandomForestClassifier() 的分数。为了使分数预测更精确,我将 cross_val_score() 的所有结果添加一个列表中,并获得该列表中数字的平均值。我还使用计时器来查看运行它需要多长时间。 这是代码的 cross_val_score() 部分:

Traceback (most recent call last):
  File "c:\Users\Desktop\working_dir\test.py",line 26,in <module>
    read.appendChild(xml)
  File "C:\Users\AppData\Local\Programs\Python\python39\lib\xml\dom\minidom.py",line 115,in appendChild
    if node.nodeType == self.DOCUMENT_FRAGMENT_NODE:
AttributeError: 'str' object has no attribute 'nodeType'

这是我得到的:

start = time.time()
big_mean = list()
i = 0
while i < 100:
    score = np.mean(cross_val_score(RFC,X,y,cv=5))
    big_mean.append(score)
    i += 1
print(sum(big_mean)/len(big_mean))
end = time.time()
print("Timer: ",end - start)

我觉得代码优化得很差。如果有更多数据,它甚至会花费超过 75 秒。哪些更改会使其成为更好的优化代码

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。