在排除NaN的情况下,按列分组并统计其他列的总数,可以使用pandas库来实现。
首先,导入pandas库并读取数据集。假设数据集的名称为df。
import pandas as pd
df = pd.read_csv("data.csv") # 读取数据集,假设数据集为CSV格式
接下来,使用dropna()方法排除包含NaN值的行。
df = df.dropna() # 排除包含NaN值的行
然后,使用groupby()方法按列分组,并使用count()方法统计其他列的总数。
result = df.groupby("列名").count() # 按列分组并统计其他列的总数,将"列名"替换为实际的列名
最后,可以打印结果或将结果保存到文件中。
print(result) # 打印结果
result.to_csv("result.csv", index=False) # 将结果保存到CSV文件中,index=False表示不保存索引
以上代码中的"列名"需要替换为实际的列名,可以根据具体的数据集进行调整。
推荐的腾讯云相关产品:腾讯云云服务器(CVM)和腾讯云数据库(TencentDB)。
领取专属 10元无门槛券
手把手带您无忧上云