使用GLOB和BS4从多个本地.html文件中提取元素并写入CSV Excel,可以通过以下步骤完成:
import glob
import csv
from bs4 import BeautifulSoup
file_paths = glob.glob('*.html') # 替换为你的本地.html文件路径
csv_file = open('output.csv', 'w', newline='')
csv_writer = csv.writer(csv_file)
csv_writer.writerow(['Element 1', 'Element 2', 'Element 3']) # 替换为你要提取的元素名称
for file_path in file_paths:
with open(file_path, 'r') as html_file:
soup = BeautifulSoup(html_file, 'html.parser')
element1 = soup.find('element1_tag').text # 替换为你要提取的第一个元素的标签
element2 = soup.find('element2_tag').text # 替换为你要提取的第二个元素的标签
element3 = soup.find('element3_tag').text # 替换为你要提取的第三个元素的标签
csv_writer.writerow([element1, element2, element3])
csv_file.close()
这样,你就可以使用GLOB和BS4从多个本地.html文件中提取元素并写入CSV Excel了。请注意,上述代码中的"element1_tag"、"element2_tag"和"element3_tag"需要替换为你要提取的元素的实际HTML标签。同时,你可以根据需要修改CSV文件的名称和列名。
领取专属 10元无门槛券
手把手带您无忧上云