使用Python从文本文件中获取链接可以通过以下步骤完成:
open()
打开文本文件。可以指定文件路径和模式参数,例如:file = open('file.txt', 'r')
readlines()
方法读取文件内容,并将每行内容存储在一个列表中,例如:lines = file.readlines()
re
模块来处理正则表达式,例如:import re
links = []
for line in lines:
# 使用正则表达式匹配链接
matches = re.findall(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', line)
links.extend(matches)
file.close()
以下是一个完整的示例代码:
import re
def get_links_from_file(file_path):
links = []
with open(file_path, 'r') as file:
lines = file.readlines()
for line in lines:
matches = re.findall(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', line)
links.extend(matches)
return links
file_path = 'file.txt'
links = get_links_from_file(file_path)
for link in links:
print(link)
通过以上步骤,你可以使用Python从文本文件中获取链接。对于后续的处理,可以根据需求进行扩展和优化。
领取专属 10元无门槛券
手把手带您无忧上云