我有一个大约100行的熊猫DataFrame,我需要从一个列中高效地为给定的索引选择值。timeit df.loc[random.randint(0, 99), 'col']似乎要快得多(大约是10倍)的是将数据帧转换为字典%timeit d['col'][random.randint(0, 99)]
#100000 loops, best of 3: 2.5 µs per lo
我想我可以在没有熊猫的情况下做到这一点,遵循这里的步骤:How to read specific lines of a large csv file 在pandas中,我尝试使用skiprows来只选择我需要的行FILESIZE) if row not in rows2keep)
signal = pd.read_csv('train.csv', skiprows=rows2skip) 我希望这段代码能很快地返回一个小的数据帧我猜它会先读取整个数据帧,然后再去掉rows2skip。 为