我在HDF5文件中保存了一个pandas.DataFrame。DataFrame由多个列组成,大小非常大。HDF5文件中每个表的大小都大于2 2GB。对于分析,希望仅将表的列的子集加载到存储器中。使用SQLite3,这是一项微不足道的工作。只需使用"select column1,colum2,... from table1“查询即可。在Python中有没有一种简单的方法可
我有一个简单的数据帧,看起来像这样。我想要能够选择所有的行,其中LOC是纽约,子集这个数据帧,并标记为一个变量,我可以用来附加纽约的行,我已经创建的电子邮件使用win32的联系人。然后搬到波士顿,做同样的事情,等等。我不知道如何在不显式命名的情况下提取LOC行。我希望随着LOC值的变化,这是动态的。 Contact LOC ...