在pandas中,可以使用drop_duplicates()
方法创建一个从没有重复的列中获取唯一值的数据帧。
具体步骤如下:
import pandas as pd
col1
和col2
是两列数据,其中col2
包含重复值。drop_duplicates()
方法创建一个新的数据帧,其中包含从没有重复的col2
列中获取的唯一值:unique_df = df.drop_duplicates(subset='col2')这里的subset='col2'
表示只考虑col2
列的重复值。这样就创建了一个从没有重复的列中获取唯一值的pandas数据帧。
推荐的腾讯云相关产品:腾讯云数据库TDSQL、腾讯云数据仓库CDW、腾讯云数据传输服务DTS。
腾讯云产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云