我有一个列出项目的DataFrame。每个项目都有多值属性A和B,每个项目具有零个或多个值。属性存储在自己的DataFrame实例中。我最初的解决方案是按项目对属性进行分组,然后对项目进行迭代,对于每个项目使用get_group来获取其A和B的值,并对这些组执行操作。One should assume that my_operation# pandas.Seriesb = g
我有一个非常简单的代码,我加载一个列表,如果id来自一个文件,然后迭代列表中的每个id,并调用一个api,我在其中传递id值并将api响应内容转储到一个文件中。我想通过并行api调用来加速这个过程,但是api服务器每秒最多只允许5次调用。另一个关键的考虑因素是api拉取很慢,平均每个调用需要10秒才能完成。这是当前的代码:import numpy as np
from joblib import Parallel, delaye