我使用Pandas创建了一个大型的带索引的HDF5表。我想重命名表中12列中的2列。我不希望重新构建/重新索引表。
可以在不复制所有数据(140 be )的情况下做到这一点吗?我希望文件中只有几个元数据,可以用正确的命令很容易地交换出来。
这是因为我有几个“非自然”列名,其中有空格,直到尝试运行select语句时,我才意识到这是一个问题。
发布于 2016-08-03 06:40:35
我担心目前没有办法重命名索引(属于data_columns
)列,因为这需要在storer.table.colindexes
和storer.table.description
对象中进行更改,而这两个对象都是特定类型的:
In [29]: store.get_storer('df').table
Out[29]:
/df/table (Table(10,)) ''
description := {
"index": Int64Col(shape=(), dflt=0, pos=0),
"a": Int32Col(shape=(), dflt=0, pos=1),
"b": Int32Col(shape=(), dflt=0, pos=2),
"c": Int32Col(shape=(), dflt=0, pos=3)}
byteorder := 'little'
chunkshape := (3276,)
autoindex := True
colindexes := {
"a": Index(6, medium, shuffle, zlib(1)).is_csi=False,
"index": Index(6, medium, shuffle, zlib(1)).is_csi=False,
"c": Index(6, medium, shuffle, zlib(1)).is_csi=False,
"b": Index(6, medium, shuffle, zlib(1)).is_csi=False}
In [30]: type(store.get_storer('df').table.colindexes)
Out[30]: tables.table._ColIndexes
In [31]: type(store.get_storer('df').table.description)
Out[31]: tables.description.Description
如果你尝试在谷歌上搜索PyTables解决方案,你会发现这个问题,但是没有/没有答案可以让你重命名列。
因此,您可能需要重新创建HDF5文件
https://stackoverflow.com/questions/38725032
复制相似问题