首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

添加新的列年份并提取给定的文件名(pandas,glob,os)

答案:

在Python中,可以使用pandas、glob和os库来添加新的列年份并提取给定的文件名。

首先,需要导入必要的库:

代码语言:txt
复制
import pandas as pd
import glob
import os

接下来,使用glob模块来获取指定文件夹下的所有文件:

代码语言:txt
复制
files = glob.glob('path_to_folder/*.csv')  # 替换为实际的文件夹路径和文件类型

然后,可以使用pandas库读取每个文件,并添加新的列年份:

代码语言:txt
复制
dataframes = []
for file in files:
    df = pd.read_csv(file)  # 根据实际情况选择适当的读取函数,如read_excel()
    file_name = os.path.basename(file)
    year = file_name.split('.')[0][-4:]  # 假设文件名格式为"filename_year.csv"
    df['年份'] = year
    dataframes.append(df)

最后,可以使用concat函数将所有数据合并为一个数据框,并保存到新文件中:

代码语言:txt
复制
result = pd.concat(dataframes)
result.to_csv('path_to_save/result.csv', index=False)  # 替换为实际的保存路径和文件名

这样,就实现了添加新的列年份并提取给定的文件名的功能。

推荐的腾讯云产品:腾讯云对象存储(COS)作为文件存储服务,可用于存储和管理处理后的文件数据。腾讯云云服务器(CVM)可用于运行代码和处理数据。

腾讯云对象存储(COS)产品介绍:https://cloud.tencent.com/product/cos

腾讯云云服务器(CVM)产品介绍:https://cloud.tencent.com/product/cvm

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

没有搜到相关的沙龙

领券