ImageDataGenerator 与 flowfromDataframe 输出时间步长

如何解决ImageDataGenerator 与 flowfromDataframe 输出时间步长

我正在尝试使用不同的图像作为输入(不是视频)来实现 CNN + LSTM 网络。我将所有层 VGG-16 与 Timedistributed 层一起使用(直到输出层之前的最后一个全连接的密集层)。最后一个 VGG 层之后是一个 LSTM 层(我希望它执行 20 个时间步长)和一个具有 sigmoid 激活的输出密集层,因为它是一个标签分类模型。这是我使用 Keras 的代码

test_datagen=ImageDataGenerator(rescale=1./255.)
train_generator=datagen.flow_from_dataframe(

dataframe=df[:132160],directory="/images/train",x_col="Filenames",y_col=columns,batch_size=batch_size,seed=42,shuffle=True,class_mode="raw",target_size=(224,224))

valid_generator=test_datagen.flow_from_dataframe(
dataframe=df[132160:144320],directory="/images/valid",224))

test_generator=test_datagen.flow_from_dataframe(
dataframe=df[144321:],directory="/images/test",batch_size=1,shuffle=False,class_mode=None,224))

imgs,labels = next(train_generator)
print(imgs.shape)

# Building the model
model = Sequential()
model.add(Timedistributed(Conv2D(filters=64,kernel_size=(3,3),padding="same",activation="relu",input_shape=(None,20,224,3))))
model.add(Timedistributed(Conv2D(filters=64,activation="relu")))
model.add(Timedistributed(MaxPooling2D(pool_size=(2,2),strides=(2,2))))
model.add(Timedistributed(Conv2D(filters=128,activation="relu")))
model.add(Timedistributed(Conv2D(filters=128,2))))
model.add(Timedistributed(Conv2D(filters=256,activation="relu")))
model.add(Timedistributed(Conv2D(filters=256,2))))
model.add(Timedistributed(Conv2D(filters=512,activation="relu")))
model.add(Timedistributed(Conv2D(filters=512,2))))
model.add(Timedistributed(Dropout(0.5)))
model.add(Timedistributed(Flatten()))
model.add(Timedistributed(Dense(units=4096,activation="relu")))
model.add(Timedistributed(Dense(units=4096,activation="relu")))
model.add(SimpleRNN(units=10))
model.add(Dropout(.2)) #added
model.add(Dense(num_class,activation="sigmoid"))
model.compile(optimizers.Adam(lr=0.0001,decay=1e-6),loss="binary_crossentropy",metrics=["accuracy"])


imgs,labels = next(train_generator)
print(imgs.shape)
model.fit(x=train_generator,steps_per_epoch=len(train_generator),validation_data=valid_generator,validation_steps=len(valid_generator),epochs=15,verbose=2
          )

此外,我收到以下错误ValueError: input tensor must have rank 4

我的问题如下:我希望 ImageDataGenerator 可以返回一个 5d 输入形状,如下所示:([batch],[time steps],[img_hight],[img_width],[channels])。此外,我希望它与 flow_from_dataframe 扩展一起使用,因为从 csv 文件中读取多标签可能会更容易。关于如何自定义 ImageDataGenerator 以获得 5d 输入形状的任何建议?或者我该如何解决这个 ValueError?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?