我想创建一个Scrapy脚本来抓取任何craigslist子域中的计算机音乐会的所有结果:例如:这个查询返回了许多文章的列表,我试图用CrawlSpider和linkExtractor抓取每个结果的标题和href (不仅仅是第一页上的结果),但没有任何结果,但是脚本什么也没有返回。我会在这里粘贴我的脚本,谢谢 from scrapy.spiders imp
我在同一个站点上使用了不同的页面,结果相同(Ex:)。我用刮壳看看我是否得到了不同的结果,但我只得到前6个链接。该页面源只显示6个链接以及。所以我有点搞不懂到底是什么问题。然而,我找到的大多数答案都说要查找下一页并刮下一页(但这仅适用于具有无限滚动的页面)。其他解决方案提到使用Selenium,但我想它也会有相同的问题,因为我们想要遵循的链接不在页面源上。下面是我为这个页面编写的脚本:import scrapy
from scra
我想抓取链接的下一页:https://www.thetoptens.com/animals/,使用scrapy-selenium点击next按钮,但它抓取了链接的第一页。我也尝试过使用webdriver,但显示了相同的结果。使用scrapy-selenium的代码: import scrapyfrom se