在pandas中,可以使用drop_duplicates()
方法根据相同的键删除行。该方法会返回一个新的DataFrame,其中不包含重复的行。
具体步骤如下:
import pandas as pd
df
。drop_duplicates()
方法删除重复行,并将结果赋值给一个新的DataFrame对象,假设为df_new
。df_new = df.drop_duplicates()
subset
参数指定列名,例如:df_new = df.drop_duplicates(subset=['column_name'])
df_new
来查看删除重复行后的结果。下面是一个示例代码:
import pandas as pd
# 创建一个DataFrame对象
data = {'key': ['A', 'B', 'A', 'C', 'B'],
'value': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 根据相同的键删除重复行
df_new = df.drop_duplicates()
# 打印删除重复行后的结果
print(df_new)
输出结果:
key value
0 A 1
1 B 2
3 C 4
推荐的腾讯云相关产品:腾讯云数据库TDSQL,产品介绍链接地址:https://cloud.tencent.com/product/tdsql
领取专属 10元无门槛券
手把手带您无忧上云