我正在抓取这个页面以获取每个Ad:的数据scrapy shell "http://www.cars2buy.co.uk/business-car-leasing/Abarth/695C/"
for content in response.xpath('//*[@class="pitem"]/div[1]/div[2]/
我仍然在学习如何做网络抓取,我正在尝试刮一个网站,从一个索引页所有的文章,然后获取他们的信息,以及全文。有了下面的代码,我可以得到我需要的所有信息-日期,时间,类别,标题-除了整篇文章。text': news.css('p.categoryArticle__excerpt::text').get()没有捕获所有的文本。下面是我到目前为止编写的代码:
class CoalNewsFromOil
我对scrapy和XPath很陌生,但用Python编程已经有一段时间了。我希望使用scrapy从页面email、name of the person making the offer和phone中获取https://www.germanystartupjobs.com/job正如您所看到的,电子邮件和电话是在<p>标签中作为文本提供的,因此很难提取。现在,