当从python对象读取数据时(这是典型的，如果您有网络访问的文件)，对数据的任何访问都将导致大约6个小的头读取，然后数据读取将是每用户块大小1 read(n)。(不幸的是)对read(n)的调用是连续的，所以很多小的读取在网络上都是缓慢的。因此，将块大小设置为合理的用例将减少read(n)调用的数量。

请注意，这里经常会有一个折衷方案。设置10kx128的块大小将强制读取所有128列，不能只读取具有该块大小的1列。但是，设置10 kx1的块大小意味着对所有128个通道的读取将导致每10k行128个read(n)调用。

如果您的数据没有按您的目的有效打包，您可以使用h5repack重新包装它(这是一个缓慢的一次性过程，不会更改数据，只是包装顺序)。

票数 0

Stack Overflow用户

发布于 2021-11-30 14:58:39

我认为使用HDF5 SWMR (单作者/多读取器)可以满足您的要求。用户指南描述了它是如何工作的，现在在h5py附例中有了支持。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67511338

复制

相似问题

问HDF5中的数据可以作为字节流实时读取吗？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问HDF5中的数据可以作为字节流实时读取吗？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问HDF5中的数据可以作为字节流实时读取吗？
EN