我正在编写一个函数,用于计算有800列的pd.DataFrame中的所有列的条件概率。我编写了几个函数的版本,发现两个主要选项在计算时间上有很大的差异:
col_sums = data.sum() #Simple Column Sum over 800 x 800 DataFrame选项#1: {'col_sums‘和'data’分别是一个系列和</
我有一个需要迭代的数据帧,并且在每次迭代时,我希望选择列值等于迭代索引的数据行,并且在每次迭代时,我希望在它生成的binned_dataframe上应用函数。X_bin和Y_bin列由0到10之间的整数值填充。所以它看起来有点像这样j = 0 for j in range(10): binned_dataframe</e