微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用 sckit-learn 进行多种分类

如何解决如何使用 sckit-learn 进行多种分类

我正在尝试对一些数据进行分类,以提供基于观察聚类的预测。我还是个新手,一直在网上浏览示例,并在尝试使用 python 实现自己时遇到了障碍。 我有一个包含 5 列数据的文件,但我只关心 3 列如何交互。 E 列是 0=否 1= 是 我想要做的是看看 A B 和 E 之间是否存在相关性。如果 A 是 0,而 B 介于 0-15 之间,看看它是 No(0) 的可能性有多大。 当然,我的数据集比这大得多。感谢引用示例或来源。

How the data looks

我一直使用 Iris 数据集示例作为模板,但在调整时出错。 以下是我一直在使用的:

df = pd.read_csv('file.csv',)
df = pd.DataFrame (df,columns= ['A','B','C','D','E'])
df.tail()

X = df.iloc[0:50000,[0,4]].values

X[0:78209]

y = df.iloc[0:50000,4].values
y = np.where(y == 0,1)
y[0:5]
plt.scatter(X[:5000,0],X[:5000,1],alpha=0.5,c='b',edgecolors='none',label='No%2s'%(y[0]))
plt.scatter(X[5000:10000,X[5000:10000,c='r',label='Yes%2s'%(y[50]))

plt.xlabel('No')
plt.ylabel('Yes')
plt.legend(loc='lower right')

plt.show()

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。