在Pandas中,可以使用drop_duplicates
方法根据两列进行去重操作。同时,可以使用drop
方法删除数据框中的指定列。
以下是根据两列去重并删除最大的第3列的步骤:
import pandas as pd
data = {'Column1': [1, 2, 3, 1, 2, 3],
'Column2': ['A', 'B', 'C', 'A', 'B', 'C'],
'Column3': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
df = df.drop_duplicates(subset=['Column1', 'Column2'])
max_value = df['Column3'].max()
df = df.drop(df[df['Column3'] == max_value].index)
df = df.drop('Column3', axis=1)
最终,df
将是一个根据两列去重并删除最大的第3列的数据框。
这个方法适用于任何需要根据两列去重并删除指定列的情况。
领取专属 10元无门槛券
手把手带您无忧上云