我的excel文件是用如下数据设置的:
REV PU LOC DEL LOC MILES RPM
3500 SANTA ANA SAN DIEGO 160 21.875
有许多(500+)相似的数据行。我想找出普通的pu/del loc和它们的平均RPM值。所以,如果上面有5条不同的条目,我想使用熊猫来平均它们的RPM值,然后输出它作为pu / del loc在一个单独的excel文件中列出的唯一值。我试图用的行是
df = df.groupby(['PU LOC', 'DEL LOC', '
我请求帮助Pandas查询,以确定最高和最低的办公室表演者。数据的示例如下所示:
OfficeNum EmployeeNum ExcellentWriting BadWriting ExcellentEvidence BadEvidence
100 34500 T F T F
100 29991 F T T F
100 10503 T F F T
101 32451 T F F T
101 55566 F T T F
101 55566 F T F T
101 64331 T
我有一个大熊猫的数据,我想平均前12行,然后接下来12行等等。我为这个任务编写了一个for循环。
df_list=[]
for i in range(0,len(df),12):
print(i,i+12)
df_list.append(df.iloc[i:i+12].mean())
pd.concat(df_list,1).T
在不使用for循环的情况下,是否有一种有效的方法来做到这一点?
我有测量某些列中电压值的数据集。我正在寻找一种优雅的方法来提取偏离平均值的行。在"volt_id“中有两个组,我希望每个组创建自己的平均值/std,并使用它们来决定哪些行偏离每个组。例如,我有如下原始数据集。
time volt_id value
0 14 A 300.00
1 15 A 310.00
2 15 B 200.00
3 16 B 210.00
4 17 B
对于某些多索引(index_col [1]),如何获得横轴为0的平均值?我有过
df:
1 2 3
h a 1 4 8
h b 5 4 6
i a 9 3 6
i b 5 2 5
j a 2 2 2
j b 4 4 4
我想要创建跨轴0 ('a','b','a','b')的第二个指标值的df1平均值。
df1:
1 2 3
0 a 4 3
Lat Lon Year Area Value group_a group_b
-31.3484 -60.0629 2019 70 24 a ia
-26.8443 -64.5456 2020 492 12 a ia
-27.6536 -62.2072 2017 173 111 b md
-26.4552 -61.4804 2020 255 76 b ct
-35.6044 -63.5238 2019 204 12 a de
我有一个数据集,它有一个连续的行和一个“标记”(数字0,1,2,…)这表明所有这些行都属于同一“图片”(例如标记=0,0,0,0,1,1,2,2,2,2,2,2,2,2,2,2,2,2,.)。现在,我希望我的程序给出每个‘图片’的平均值,例如,所有的数字=0都属于图0,并计算出该标记内整个数据帧的平均值。到目前为止,我尝试过这个:
###Read data in:
df = pd.read_csv(path_i, sep = ",")
#### Calculate means per picture:
number = 0
for i in df:
pic
我有一个X和Y列的数据格式,如下所示。
我需要添加另一列Z,它是当前和前2行Y列的平均值。同时,当X值发生变化时,应按如下所示重新计算平均值。我知道我可以对整个数据使用shift函数来计算平均值,但是当X值发生变化时,我如何重新计算平均值。
X Y Z
a 1 1
a 2 1.5
a 3 2
a 4 3
b 10 10
b 20 15
b 30 20