在数据框中找到两个列A和B之间的单词交集并创建一个新列C,可以通过以下步骤实现:
import pandas as pd
# 加载数据框
df = pd.read_csv('data.csv')
def find_word_intersection(a, b):
# 将每个单元格的值拆分为单词
words_a = set(str(a).split())
words_b = set(str(b).split())
# 找到两个集合之间的交集
intersection = words_a.intersection(words_b)
return ' '.join(intersection)
# 应用函数并创建新列C
df['C'] = df.apply(lambda row: find_word_intersection(row['A'], row['B']), axis=1)
print(df)
这样,你就可以在数据框中找到两个列A和B之间的单词交集,并创建一个新列C。请注意,以上代码示例中的"data.csv"是一个示例数据文件名,你需要根据实际情况修改为你的数据文件名。
领取专属 10元无门槛券
手把手带您无忧上云