但是,我希望使用Scrapy的方法来进行修改,而不是使用lxml,因为同时使用Scrapy选择器和lxml实际上意味着在响应中查找相同的元素需要加倍的代码。 # Scrape thumbnail URLs using Scrapy selectors
for post in response.css('.post'): # For each <e
当我检查Network中的页面时,我看到这个页面使用AJAX请求(类型POST)将其数据获取到API,这些请求是在加载布局后由浏览器完成的。我已经使用下面的shell命令进行了快速测试,并获得了数据。class FtseSpider(scrapy.Spider): #allowed_domains = ['www.ftserussell.com', 'www.ftse.comprams_dict_ = {k: v[0] for k, v in pa