使用Pandas从不同Excel表格中的一行中获取某个字符串,可以按照以下步骤进行操作:
import pandas as pd
import glob
glob
模块获取所有Excel文件的文件路径:file_paths = glob.glob('*.xlsx') # 根据实际文件路径进行修改
result_df = pd.DataFrame(columns=['File', 'String'])
for file_path in file_paths:
df = pd.read_excel(file_path) # 根据实际情况选择读取方法
target_string = '目标字符串' # 根据实际需求进行修改
row_with_string = df[df.apply(lambda row: target_string in row.values, axis=1)]
result_df = result_df.append({'File': file_path, 'String': row_with_string}, ignore_index=True)
print(result_df)
result_df.to_excel('result.xlsx', index=False) # 根据实际需求选择打印或保存方法
在上述代码中,我们首先使用glob
模块获取所有Excel文件的文件路径。然后,创建一个空的DataFrame用于存储结果。接下来,我们遍历每个Excel文件,使用Pandas的read_excel
方法读取数据,并使用apply
函数查找包含目标字符串的行。最后,将结果添加到结果DataFrame中,并打印或保存结果。
请注意,上述代码中的文件路径、目标字符串和保存结果的方式都需要根据实际情况进行修改。此外,我们还可以根据具体需求进行优化和扩展,例如添加错误处理、多线程处理等。
领取专属 10元无门槛券
手把手带您无忧上云