在pandas DataFrame中找到每行的集合差异可以通过以下步骤实现:
import pandas as pd
data = {'A': ['apple, banana', 'orange, banana', 'apple, orange'],
'B': ['banana, orange', 'apple', 'banana']}
df = pd.DataFrame(data)
def find_set_difference(row):
set_A = set(row['A'].split(', '))
set_B = set(row['B'].split(', '))
difference = set_A - set_B
return ', '.join(difference)
df['Difference'] = df.apply(find_set_difference, axis=1)
通过以上步骤,DataFrame中的每行将会生成一个新的列'Difference',其中包含该行集合的差异。
这种方法可以用于比较两个集合的差异,并根据实际情况进行调整。在实际应用中,根据不同的需求可以使用其他方法来处理集合的差异。
推荐的腾讯云相关产品:无
请注意,本回答没有提及任何特定的云计算品牌商,仅根据问题描述给出了解决方案。如果需要了解更多关于pandas的用法,可以参考pandas官方文档。
领取专属 10元无门槛券
手把手带您无忧上云