,可以使用Pandas库来实现。
首先,我们需要导入Pandas库:
import pandas as pd
然后,我们可以创建两个数据帧df1和df2,用于合并:
df1 = pd.DataFrame({'A': [1, 2, 3, 4], 'B': ['a', 'b', 'c', 'd']})
df2 = pd.DataFrame({'A': [3, 4, 5, 6], 'B': ['c', 'd', 'e', 'f']})
接下来,我们使用concat函数将两个数据帧合并,并设置参数ignore_index为True,以重新索引合并后的数据帧:
merged_df = pd.concat([df1, df2], ignore_index=True)
现在,我们可以使用duplicated函数找到重复项的索引:
duplicates = merged_df.duplicated()
然后,我们可以使用drop_duplicates函数移除重复项,并设置参数keep为False,以保留重复项在原始数据集中的位置:
merged_df.drop_duplicates(keep=False, inplace=True)
最后,我们可以打印出移除重复项后的数据帧:
print(merged_df)
完整的代码如下:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3, 4], 'B': ['a', 'b', 'c', 'd']})
df2 = pd.DataFrame({'A': [3, 4, 5, 6], 'B': ['c', 'd', 'e', 'f']})
merged_df = pd.concat([df1, df2], ignore_index=True)
duplicates = merged_df.duplicated()
merged_df.drop_duplicates(keep=False, inplace=True)
print(merged_df)
这样,我们就从合并的数据帧中移除了重复项,并将重复项保留在原始数据集中。
领取专属 10元无门槛券
手把手带您无忧上云