我有一个以竖线分隔的数据文件,但有时空值在两个分隔符之间没有数据,导致分隔符字符被放在相应的列中,随后的列被填充NaN值。我创建数据帧的代码如下:
for DF_Exec in pd.read_table(ExecSrcFile, sep='|', chunksize=5000, header=1, low_memory=这些都工作得很好。分隔符之间的空格或空符
我希望在给定特定条件的情况下,将Pandas的DataFrame中的列聚合为1。这个想法是为了节省DF中的空间,并将一些列聚合成一个列,前提是它们满足特定的条件。举个例子可能会让它更容易解释:import seaborn as sns # for sample data set
# load some sample例如)聚合到一个名为'20+‘的列中,值将
因此,我尝试从制表符分隔的文本文件创建一个dataframe,目标是使用该dataframe列标头的一列中的值,并使用另一列作为值。当我尝试df.pivot时,我得到了我想要的,但是新的列添加了额外的NaN值,而不仅仅是正确地排列新行。制表符分隔的文本文件基本上如下所示: round1 are you h