https://unicodono.com.br/anuncios/itens/ajax?page=1 这是将数据动态加载到页面的AJAX调用。我认为我正确地发送了表单和标题,但响应返回错误419,crawler停止运行。我不知道如何解释这个错误。我的蜘蛛是不是漏掉了什么?menor_valor'}
for url in self.
因此,我试图从页面中获得更多的数据,这取决于我使用Scrapy从下拉列表中选择了什么。在下面的代码中,首先我得到下拉列表中的所有元素,它工作得很好。# run this file asfrom scrapy.spiders importitem['Course']=course[2] return items
编辑:这里
我希望了解更多关于如何使用Scrapy登录网站。我看了一些文档和教程,最终来到了Using FormRequest.from_response() to simulate a user login。这将向https://www.eventbrite.ca/api/v3/users/lookup/发送一个POST请求,其中只包含所提供的电子邮件,如果一切正常,网页将使用JS将您“重定向”到https一旦你填写你的密码并点击表单按钮,如果成功,它将redirect+gener