,可以通过以下步骤完成:
以下是一种可能的Python实现示例:
import csv
import requests
from bs4 import BeautifulSoup
import re
# 读取CSV文件
url_list = []
with open('urls.csv', 'r') as csv_file:
csv_reader = csv.reader(csv_file)
for row in csv_reader:
url_list.append(row[0])
# 抓取电子邮件
email_list = []
for url in url_list:
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
email_elements = soup.find_all(text=re.compile(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'))
for element in email_elements:
email_list.append(element)
# 保存电子邮件
with open('emails.csv', 'w', newline='') as csv_file:
csv_writer = csv.writer(csv_file)
for email in email_list:
csv_writer.writerow([email])
这个示例代码使用Python的csv、requests、BeautifulSoup和re模块,读取名为urls.csv的CSV文件,对其中的每个URL进行HTTP请求,解析返回的HTML内容,并使用正则表达式查找电子邮件地址。最后,将提取到的电子邮件地址保存到名为emails.csv的CSV文件中。
请注意,这只是一个示例实现,实际应用中可能需要根据具体情况进行适当的调整和优化。
领取专属 10元无门槛券
手把手带您无忧上云