Link of the data sets of csv file
Link包含.csv
文件,其中一列是状态名称和脱牙数量。我想要计算每个州儿童的平均缺牙数。我尝试使用df.interrows
,但我不能对任何特定行的列值使用condition。
for row in df.iterrows():
if row["State"] == "NSW":
Count += row["Number of teeth lost"]
如果新南威尔士州包含3个值2,3,4,那么我需要计算这三个数字的平均值,对于其他六个州也是如此。我使用pandas来操作csv文件。
发布于 2020-01-16 08:33:15
尝试使用df.loc[df['State'] == "NSW"]['Number of tooth lost'].mean()
它选择.loc
括号内条件为true的所有行,然后只选择列“Number of mean”来计算平均值。
这比像您那样迭代所有行要快得多,因为pandas在较低级别上处理操作。
https://stackoverflow.com/questions/59765553
复制