如何解决keras 中的 One-hot 编码标签
我有一组来自 CSV 文件中标签列的整数 - [1,2,4,3,5,..]
。类的数量是5
,即1
到6
的范围。我想使用以下代码对它们进行单热编码。
y = df.iloc[:,10].values
y = tf.keras.utils.to_categorical(y,num_classes = 5)
y
IndexError: index 5 is out of bounds for axis 1 with size 5
我该如何解决这个问题?
解决方法
如果您使用 tf.keras.utils.to_categorical
对标签向量进行 one-hot,则整数应从 0
开始到 num_classes
、source。在您的情况下,您应该执行以下操作
import tensorflow as tf
import numpy as np
a = np.array([1,2,4,3,5,1])
y_tf = tf.keras.utils.to_categorical(a-1,num_classes = 5)
y_tf
array([[1.,0.,0.],[0.,1.,1.],[1.,0.]],dtype=float32)
或者,您可以使用 pd.get_dummies
,
import pandas as pd
import numpy as np
a = np.array([1,1])
a_pd = pd.get_dummies(a).astype('float32').values
a_pd
array([[1.,dtype=float32)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。