背景
我正在分别做一些模拟。通过各种参数(在本例中仅限rpm
)进行的系统分析,并将结果数据帧results_df
的每一行都附加到一个汇总数据帧df
,其中包含根据变化的rpm
给出我的系统的性能。
为了获得用于绘图和数据分析的适当索引,我将列表中的不同值(这里是rpm
)转换为pandas序列ser
,并将此序列与包含我感兴趣的结果的汇总数据帧df
连接起来。
因为我感兴趣的每个计算的结果只是每个计算的最后一行,所以我使用.tail(1)
从结果数据帧results_df
中提取这些数据。
到目前为止,我所做的工作如以下代码片段所示:
rpm = [0.25, 0.3, 0.5, 0.75, 1.0, 1.5, 2.0]
ser = pd.Series(rpm, name='rpm')
df = pd.DataFrame()
df_list = list()
for i, val in enumerate(rpm):
results_df = get_some_data_from_somwhere()
df_list.append(results_df.tail(1))
df = df.append(df_list, ignore_index=True)
df = pd.concat([df, ser], axis=1)
df.set_index('rpm', inplace=True)
with open('foo.csv', 'w') as f:
data.to_csv(f, index=True, header=True, decimal=',', sep=' ', float_format='%.3f')
问题
我得到的这个csv文件的格式如下:
rpm cooling_inner heating_inner cooling_outlet heating_outlet
0.25 303,317 323,372 302,384 324,332
但是,我希望索引列上有三个十进制数字和一个逗号作为小数符号,如下所示:
rpm cooling_inner heating_inner cooling_outlet heating_outlet
0,250 303,317 323,372 302,384 324,332
因此,在使用.to_csv
命令将数据帧导出到csv文件时,index
和decimal
符号选项似乎没有应用于索引列。
既然index
选项设置为True
,并且所有值(索引列除外)都具有正确的格式和小数符号,我如何实现此行为?
我必须以某种方式分开处理索引列吗?
发布于 2015-07-23 12:05:56
我会重写你的两条底线:
with open('foo.csv', 'w') as f:
data.to_csv(f, index=True, header=True, decimal=',', sep=' ', float_format='%.3f')
转到
data.reset_index().to_csv('foo.csv', index=False, header=True, decimal=',', sep=' ', float_format='%.3f')
这是一种变通方法,但正如您已经注意到的,关键字参数decimal=
和float_format=
仅适用于data列,而不适用于索引。
相反,我所做的是使用reset_index
将索引放入数据帧中,然后告诉to_csv(index=False
不要将索引保存到文件中(因为它现在在数据中)。
此外,自己打开一个文件流(with open('foo.csv', 'w') as f:
)最好留给pandas,当您只给它一个字符串'foo.csv'
作为第一个参数时,它会自己完成这项工作。
https://stackoverflow.com/questions/31586162
复制相似问题