可以通过正则表达式来实现。下面是一个示例代码:
import re
def extract_text_between_strings(file_path, start_string, end_string):
with open(file_path, 'r') as file:
content = file.read()
pattern = re.escape(start_string) + '(.*?)' + re.escape(end_string)
match = re.search(pattern, content, re.DOTALL)
if match:
extracted_text = match.group(1)
return extracted_text
else:
return None
file_path = 'example.txt'
start_string = 'START'
end_string = 'END'
extracted_text = extract_text_between_strings(file_path, start_string, end_string)
print(extracted_text)
上述代码中,extract_text_between_strings
函数接受三个参数:file_path
表示文本文件的路径,start_string
表示起始字符串,end_string
表示结束字符串。函数通过正则表达式将起始字符串和结束字符串之间的文本提取出来,并返回提取到的文本。
需要注意的是,上述代码中使用了re.escape
函数来转义起始字符串和结束字符串,以确保它们被当作普通字符串而不是正则表达式中的特殊字符。另外,re.DOTALL
标志用于匹配跨行的文本。
这是一个简单的示例,实际应用中可能需要根据具体的文本文件格式和提取需求进行适当的调整。
领取专属 10元无门槛券
手把手带您无忧上云