答案:
在Python中,可以使用pandas、glob和os库来添加新的列年份并提取给定的文件名。
首先,需要导入必要的库:
import pandas as pd
import glob
import os
接下来,使用glob模块来获取指定文件夹下的所有文件:
files = glob.glob('path_to_folder/*.csv') # 替换为实际的文件夹路径和文件类型
然后,可以使用pandas库读取每个文件,并添加新的列年份:
dataframes = []
for file in files:
df = pd.read_csv(file) # 根据实际情况选择适当的读取函数,如read_excel()
file_name = os.path.basename(file)
year = file_name.split('.')[0][-4:] # 假设文件名格式为"filename_year.csv"
df['年份'] = year
dataframes.append(df)
最后,可以使用concat函数将所有数据合并为一个数据框,并保存到新文件中:
result = pd.concat(dataframes)
result.to_csv('path_to_save/result.csv', index=False) # 替换为实际的保存路径和文件名
这样,就实现了添加新的列年份并提取给定的文件名的功能。
推荐的腾讯云产品:腾讯云对象存储(COS)作为文件存储服务,可用于存储和管理处理后的文件数据。腾讯云云服务器(CVM)可用于运行代码和处理数据。
腾讯云对象存储(COS)产品介绍:https://cloud.tencent.com/product/cos
腾讯云云服务器(CVM)产品介绍:https://cloud.tencent.com/product/cvm
领取专属 10元无门槛券
手把手带您无忧上云