,可以通过以下步骤实现:
import pandas as pd
data = {'col1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 15, 15, 15],
'col2': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 15, 15, 15]}
df = pd.DataFrame(data)
counts = df.groupby(['col1', 'col2']).size().reset_index(name='count')
repeated_cols = counts[counts['count'] >= 15]
df = df[~df.isin(repeated_cols)].dropna()
完成以上步骤后,df DataFrame对象将不包含重复15次以上的列值。
这个方法的优势是简单易懂,适用于处理小规模的数据集。它可以帮助我们快速识别和删除重复值,提高数据的准确性和可靠性。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云