在Pandas中,要删除DataFrame(df)中不满足条件的重复行,可以使用以下步骤:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 4, 5],
'B': ['a', 'b', 'c', 'd', 'd', 'e']})
df = df.drop_duplicates(subset=['A'], keep=False)
在上述代码中,我们使用了subset参数来指定根据哪些列进行重复行的判断。在这个例子中,我们根据列'A'进行判断。另外,通过设置keep参数为False,可以删除所有重复行,而不仅仅是保留第一个或最后一个重复行。
print(df)
完整的代码如下所示:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 4, 5],
'B': ['a', 'b', 'c', 'd', 'd', 'e']})
df = df.drop_duplicates(subset=['A'], keep=False)
print(df)
这样,不满足条件的重复行就会被删除,并且打印出删除后的DataFrame。
关于Pandas的drop_duplicates()方法的更多信息,可以参考腾讯云的相关产品文档:Pandas drop_duplicates()方法。
领取专属 10元无门槛券
手把手带您无忧上云