在Python中,可以使用不同的方法来计算两个DataFrame之间的匹配百分比。下面是一种常见的方法:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [1, 2, 4], 'B': [4, 5, 7]})
indicator=True
来保留合并的信息:merged = pd.merge(df1, df2, how='outer', indicator=True)
only_df1 = merged[merged['_merge'] == 'left_only']
percentage_df1 = len(only_df1) / len(df1) * 100
only_df2 = merged[merged['_merge'] == 'right_only']
percentage_df2 = len(only_df2) / len(df2) * 100
matched = merged[merged['_merge'] == 'both']
percentage_matched = len(matched) / len(df1) * 100
综上所述,我们可以使用上述方法计算两个DataFrame的匹配百分比。这种方法适用于比较两个DataFrame中的数据差异,并可以根据需要进行进一步的处理和分析。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云