在导入到pandas时,可以使用pandas.concat()
函数直接合并多个CSV文件。pandas.concat()
函数可以按照指定的轴(默认为0,即按行合并)将多个DataFrame对象连接在一起。
以下是一个示例代码:
import pandas as pd
import glob
# 获取所有CSV文件的文件路径
file_paths = glob.glob('*.csv')
# 创建一个空的DataFrame用于存储合并后的数据
merged_data = pd.DataFrame()
# 循环读取并合并所有CSV文件
for file_path in file_paths:
df = pd.read_csv(file_path)
merged_data = pd.concat([merged_data, df])
# 打印合并后的数据
print(merged_data)
上述代码中,首先使用glob.glob()
函数获取当前目录下所有的CSV文件路径,并存储在file_paths
列表中。然后创建一个空的DataFrame对象merged_data
用于存储合并后的数据。
接下来,使用循环遍历每个CSV文件的路径,使用pd.read_csv()
函数读取CSV文件并将其存储在名为df
的DataFrame对象中。然后使用pd.concat()
函数将df
与merged_data
进行合并,并将合并后的结果重新赋值给merged_data
。
最后,打印合并后的数据merged_data
。
这种方法适用于需要合并多个CSV文件的情况,例如多个CSV文件包含相同的列,但是行数不同。
没有搜到相关的沙龙
领取专属 10元无门槛券
手把手带您无忧上云