我的python代码成功地从https://www.groupeactual.eu/offre-emploi中抓取文本并将其保存到csv文件中。然而,在上面的网站上有多个页面可用,我希望能够在其中刮。例如,使用上面的url,当我单击指向"page 2“的链接时,整个url会发生变化,但当我在代码中使用该url时,我会得到来自page 1的结果。 如何更改我的代码以从所有列出的可用页面中抓取数据?我的代码: from bs4 import B
我想使用BeautifulSoup抓取这个website,首先提取每个链接,然后一个接一个地打开它们。一旦他们被打开,我想刮公司的名称,它的股票代码,股票交易和提取多个PDF链接时,他们是可用的。为了实现这一点,我首先尝试这样做: import requestsimport re url = base + link