在Python中,可以使用pandas库来处理和操作表格数据。要组合两个具有不同单元格的重复行,可以按照以下步骤进行编码:
import pandas as pd
data = {'A': ['foo', 'bar', 'foo', 'bar'],
'B': [1, 2, 3, 4],
'C': ['x', 'y', 'z', 'w']}
df = pd.DataFrame(data)
groupby
和apply
方法来组合具有不同单元格的重复行:df_combined = df.groupby(['A']).apply(lambda x: ', '.join(x['C'])).reset_index()
这将根据列'A'的值组合具有不同单元格的重复行,并将结果存储在一个新的DataFrame对象df_combined
中。每个组合的结果将使用逗号分隔。
完整的代码示例:
import pandas as pd
data = {'A': ['foo', 'bar', 'foo', 'bar'],
'B': [1, 2, 3, 4],
'C': ['x', 'y', 'z', 'w']}
df = pd.DataFrame(data)
df_combined = df.groupby(['A']).apply(lambda x: ', '.join(x['C'])).reset_index()
print(df_combined)
输出结果:
A 0
0 bar y, w
1 foo x, z
在这个例子中,根据列'A'的值,将具有不同单元格的重复行组合起来,并将结果存储在新的DataFrame对象中。
领取专属 10元无门槛券
手把手带您无忧上云