在pandas中删除外连接上的重叠行,可以通过以下步骤实现:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [3, 4, 5], 'B': [6, 7, 8]})
merged_df = pd.merge(df1, df2, how='outer')
duplicated_rows = merged_df.duplicated()
cleaned_df = merged_df.drop_duplicates()
完整的代码示例如下:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [3, 4, 5], 'B': [6, 7, 8]})
merged_df = pd.merge(df1, df2, how='outer')
duplicated_rows = merged_df.duplicated()
cleaned_df = merged_df.drop_duplicates()
print(cleaned_df)
这样,cleaned_df就是删除了外连接上的重叠行的DataFrame对象。
推荐的腾讯云相关产品:腾讯云数据库TDSQL、腾讯云云服务器CVM、腾讯云对象存储COS。
请注意,以上推荐的腾讯云产品仅供参考,具体选择应根据实际需求进行评估和决策。
领取专属 10元无门槛券
手把手带您无忧上云