答案:
从多个不同的网址提取XPath到Excel文件可以通过使用Python编程语言和相关库来实现。下面是一个完善且全面的答案:
import requests
from lxml import etree
import openpyxl
# 定义要提取的网址列表
urls = ['http://example.com/page1', 'http://example.com/page2', 'http://example.com/page3']
# 创建Excel文件和工作表
workbook = openpyxl.Workbook()
worksheet = workbook.active
# 遍历网址列表
for url in urls:
# 发送HTTP请求并获取网页内容
response = requests.get(url)
html = response.text
# 使用lxml库解析HTML
tree = etree.HTML(html)
# 使用XPath提取目标数据
data = tree.xpath('//div[@class="content"]/text()')
# 将提取的数据写入Excel文件
for i, item in enumerate(data):
worksheet.cell(row=i+1, column=1, value=item)
# 保存Excel文件
workbook.save('data.xlsx')
以上代码使用了requests
库发送HTTP请求获取网页内容,使用lxml
库解析HTML,并使用XPath提取目标数据。最后,将提取的数据写入Excel文件并保存。
希望以上答案能够满足您的需求。如果还有其他问题,请随时提问。
领取专属 10元无门槛券
手把手带您无忧上云