我正在开发一个打开网页的网页,如果该链接包含关键字,我将打印该网页中的任何链接(稍后我将打开这些链接,以便进一步抓取)。
例如,我使用请求模块打开"cnn.com",然后尝试解析该网页中的所有href/链接。然后,如果任何链接包含特定的单词(如“中国”),Python应该打印该链接。
我只需使用请求打开主页,将所有的href保存到列表(“链接”)中,然后使用:
links = [...]
keyword = "china"
for link in links:
if keyword in link:
print(link)
但是,这个方法的
我目前正在阅读Automate the Stuff with Python,并试图学习如何使用Selenium。现在,我只是想打开一个网页,甚至不能让它工作。我知道使用python启动网页有更简单的方法,但我的目标是稍后处理网页内容,所以这就是我使用selenium的原因。
from selenium import webdriver
driver = webdriver.Firefox()
driver.get("http://www.python.org")
当我运行这段代码时,它确实成功地启动了Firefox,但它没有打开我指定的网页。也会返回此错误。
Traceback