我有一个大型的pandas Series (50 million+),我需要用32位Python进行排序,但在排序过程中我得到了一个MemoryError。似乎pandas的排序算法在排序过程中会生成几个临时数组。我知道我可以使用numpy的排序算法,但是我可以使用pandas API中的另一种排序算法,它具有更小的内存占用空间?
在python中,是否有任何算法来查找未排序数组中k个最小数的索引?我知道如何使用numpy模块来实现这一点,但我并不是在寻找它。我立即想到的一个方向是,它必须与排序算法有关。因此,假设我有一个algo来使用冒泡排序对python中的数组进行排序:n = len(arr)
# Traverse through all array,只返回数组中k个最小数的索引,如果使用排序算法</e