在Pandas中,可以使用merge()函数将多个DataFrame按照指定的列进行连接。连接的条件可以通过指定on参数来实现。
具体步骤如下:
import pandas as pd
result = pd.merge(df1, df2, on=['col1', 'col2'], how='inner')
final_result = pd.merge(result, df3, on='col3', how='left')
连接多个条件的DataFrame时,需要确保连接的列在各个DataFrame中都存在,并且列名相同。
以下是一个示例代码:
import pandas as pd
# 创建示例DataFrame
df1 = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['A', 'B', 'C']})
df2 = pd.DataFrame({'col1': [2, 3, 4], 'col2': ['B', 'C', 'D']})
df3 = pd.DataFrame({'col3': [3, 4, 5], 'col4': ['C', 'D', 'E']})
# 连接df1和df2
result = pd.merge(df1, df2, on=['col1', 'col2'], how='inner')
# 连接result和df3
final_result = pd.merge(result, df3, on='col3', how='left')
print(final_result)
以上代码输出的final_result为:
col1 col2 col3 col4
0 3 C 3.0 C
1 3 C 4.0 D
2 2 B NaN NaN
领取专属 10元无门槛券
手把手带您无忧上云