将不同文件夹中的CSV文件读取到数据框中,从现有CSV/数据帧中追加数据可以通过以下步骤实现:
- 导入所需的库和模块:import os
import pandas as pd
- 定义一个函数来读取指定文件夹中的CSV文件并将其追加到数据框中:def read_csv_files(folder_path, existing_dataframe):
for file in os.listdir(folder_path):
if file.endswith(".csv"):
file_path = os.path.join(folder_path, file)
df = pd.read_csv(file_path)
existing_dataframe = existing_dataframe.append(df, ignore_index=True)
return existing_dataframe
- 创建一个空的数据框作为现有CSV/数据帧:existing_dataframe = pd.DataFrame()
- 调用函数来读取不同文件夹中的CSV文件并追加到现有CSV/数据框中:folder_path1 = "路径/文件夹1"
existing_dataframe = read_csv_files(folder_path1, existing_dataframe)
folder_path2 = "路径/文件夹2"
existing_dataframe = read_csv_files(folder_path2, existing_dataframe)
可以根据需要继续添加更多的文件夹路径
完成以上步骤后,不同文件夹中的CSV文件将被读取并追加到现有的数据框中。请注意,函数read_csv_files
中的folder_path
参数应该是文件夹的路径,而不是文件的路径。
这种方法适用于需要将多个CSV文件合并为一个数据框的情况,例如在数据分析和数据处理中。对于大规模的数据集,可能需要考虑性能和内存方面的因素,并采用其他方法来处理数据。