我正在从事一个深度学习项目,我正面临一个数据集大小的问题。我想为视频数据集顺序事项制作一条管道。因为如果我尝试加载整个数据集,那么TensorFlow通过一个错误,这间接意味着内存不足。我在官方的TensorFlow文档中阅读了关于tf.keras.preprocessing.image.ImageDataGenerator
、tf.data
和tf.data.Dataset
的文档,这些文档用于为图像数据集创建管道,以批量加载它们并避免内存瓶颈。这个问题是,我想做同样的事情,但使用视频数据集。正如你所知道的,视频是由帧组成的,帧的顺序在识别问题中起着很重要的作用。我希望从每个视频中提取出帧并按顺序加载到RAM中,以训练我的模型,我还想以高效的方式实现这一点(在给定的时间加载5个视频样本以避免内存问题)。
数据集的文件结构附后:
发布于 2022-11-01 14:20:40
如果您的VRAM是有限的,您应该应用这些文章中描述的小批:
https://blog.paperspace.com/how-to-maximize-gpu-utilization-by-finding-the-right-batch-size/
如果你的迷你批次很小,也许你必须增加迭代才能得到好的结果。
https://datascience.stackexchange.com/questions/114812
复制相似问题