我使用库进行多处理。虽然这个库很适合更快的处理,但是它在merge上失败了,我想在代码之间恢复到默认的熊猫。import pandas as pdimport osos.environ["MODIN_ENGINE"] = "ray"
do stuff
然后,我想在相同的代码中恢复到默认的大熊猫,但我将如何<
我需要用于我的Pandas DataFrame的键行索引,其中key是Pandas DataFrame的id列,data是行数据。iterrows这样做:for pair_id, data in df.iterrows():然而,对于非常多的行(有没有更快的方法来为Pandas创建稀疏的密钥行索引,这样任意访问任何行的速度就会更快吗?更好的是,
我有一个很大的DataFrame,并且想要更快地运行以下代码(这是正确的),以减少处理时间。逻辑:我想按递增(累积)顺序对每一列中的值进行排序,但当遇到‘0行’(例如:第5行)时,将跳过该行(代码: if row2 == 0: continue)。我想让这段代码运行得更快。如果使用下面的代码,那么遍历形状为(1305个,3000行)的df大约需要1.5分钟才能完成。在这方面需要帮助,以减少处理时间。import pandas as p