在Pandas中,可以使用drop_duplicates
方法根据两列进行去重操作。同时,可以使用drop
方法删除数据框中的指定列。
以下是根据两列去重并删除最大的第3列的步骤:
import pandas as pd
data = {'Column1': [1, 2, 3, 1, 2, 3],
'Column2': ['A', 'B', 'C', 'A', 'B', 'C'],
'Column3': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
df = df.drop_duplicates(subset=['Column1', 'Column2'])
max_value = df['Column3'].max()
df = df.drop(df[df['Column3'] == max_value].index)
df = df.drop('Column3', axis=1)
最终,df
将是一个根据两列去重并删除最大的第3列的数据框。
这个方法适用于任何需要根据两列去重并删除指定列的情况。
DBTalk
云+社区技术沙龙[第9期]
云+社区技术沙龙[第10期]
云+社区沙龙online第5期[架构演进]
云+社区开发者大会(北京站)
云+社区技术沙龙[第16期]
云+社区技术沙龙[第21期]
云+社区开发者大会 武汉站
云+社区技术沙龙[第26期]
云+社区技术沙龙[第23期]
云+社区技术沙龙第33期
领取专属 10元无门槛券
手把手带您无忧上云