本文介绍基于Python语言,针对一个文件夹下的大量栅格遥感影像文件,基于其各自的文件名,分别创建指定名称的新文件夹,并将对应的栅格遥感影像文件复制到不同的新文件夹下的方法。
首先,我们来看一下本文需要实现的需求。现有一个文件夹,其中有大量.tif
格式的栅格遥感影像文件,以及.xml
、ovr
等格式的遥感影像辅助信息文件,如下图所示。
其中,如上图中紫色框所示,每一景遥感影像文件的文件名称中,都有一个表示其编号的字段;我们希望基于这一编号字段,将带有相同编号字段的栅格遥感影像文件,以及其对应的辅助信息文件,都复制到一个结果文件夹中;这个结果文件夹如下图所示。
其中,结果文件夹内含有多个不同编号的子文件夹,这个编号就是上上图中,栅格遥感影像所带有的编号。例如,我们希望将所有文件名称中带有15
字段的栅格遥感影像文件及其辅助信息文件,都复制到结果文件夹中名称为15
的子文件夹中,以此类推。
知道了具体需求,我们即可开始代码的撰写。本文所用到的代码如下所示。
# -*- coding: utf-8 -*-
"""
Created on Mon Feb 13 20:25:04 2023
@author: fkxxgis
"""
import os
import re
import shutil
tif_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\Result"
result_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\ResultFolder"
file_list = os.listdir(tif_file_path)
for file in file_list:
file_id_suffix = file.split("_")[2]
file_id = re.findall("\d+", file_id_suffix)[0]
if not os.path.exists(os.path.join(result_file_path, file_id)):
os.makedirs(os.path.join(result_file_path, file_id))
print("Make " + file_id + " path.")
shutil.copy(os.path.join(tif_file_path, file), os.path.join(result_file_path, file_id, file))
其中,tif_file_path
是存储有原有待复制遥感影像文件的文件夹,result_file_path
则表示最终的结果文件夹。
代码的整体思路也非常简单。首先,我们需要导入os
、re
与shutil
等3
个Python库,分别实现系统文件遍历、字符串匹配与遥感影像文件的复制。其次,我们通过os.listdir()
函数,遍历待复制遥感影像文件对应的文件夹,获取其中的每一个文件;这里的文件既包括.tif
格式的栅格遥感影像文件,同时也包括.xml
、ovr
等格式的遥感影像辅助信息文件。
随后,对每一个文件加以处理。我们基于每一个文件的文件名称的规则,通过split()
函数,将其中表示编号的字段以及这一字段之后的内容提取出来;紧接着,基于re.findall()
函数,通过字符串匹配的方式,将表示编号的字段(也就是文件名称中的数字部分)提取出来。
接下来,知道了当前文件对应的编号,我们就可以开始复制工作。但是这里需要注意,由于我们需要将每一个文件都放入结果文件夹中的子文件夹,因此需要首先判断当前子文件夹有没有被建立;如果没有创建的话,我们需要创建一下这个子文件夹。这一步骤通过if
判断语句及其内部的代码即可实现——通过os.path.exists()
函数判断是否存在指定的子文件夹,如果不存在的话就新建这一子文件夹。
随后,就可以开始文件的复制工作了。这一步骤我们通过shutil.copy()
函数即可实现。
运行上述代码后,我们即可在结果文件夹中看到各个编号对应的子文件夹,并在子文件夹中看到这一编号对应的全部文件。如下图所示,可以看到结果文件夹中,名称为15
的子文件夹内,包含的就是文件名称中带有15
字段的所有遥感影像文件及其对应的辅助信息文件。
至此,大功告成。