如何修复在scrapy中加载更多ajax请求

文章/答案/技术大牛

发布

1回答

、、

scrapy shell "https://www.industrystock.com/html/hydraulic-cylinder/product-result-uk-19931-0.html" 'beta': 'false', 'ac

浏览 11提问于2019-07-22得票数 0

回答已采纳

1回答

使用scrapy进行web抓取数据的难度

、、、

我正在尝试从https://www.ta.com/portfolio/business-services中使用scrapy抓取数据，但是响应为空。我正在寻找抓取href在div.tiles js-portfolio-tiles中使用代码response.css("div.tiles.js-portfolio-tiles a::attr(href)如何解压这个文件？website HTML

浏览 10提问于2020-01-17得票数 0

回答已采纳

1回答

因此，在抓取这个url之前，我通过scrapy登录，然后通过这个结果页面登录。但是，即使这个页面的http响应是200，它也不会丢弃任何数据。守则如下：from scrapy.spider import BaseSpiderfrom scrapy.selectorimport HtmlXPathSelector from scrapy.contrib.spiders import Crawl

浏览 3提问于2013-05-31得票数 5

2回答

外壳和蜘蛛中的Scrapy处理ajax连续响应数据

、、、、

我正在尝试在ajax请求之后抓取加载的数据。scrapy shell https://www.youtube.com

浏览 1提问于2015-10-24得票数 1

2回答

Scrapy crawler无法从多个页面爬行数据

、、、

代码(针对单个页面)如下所示： from scrapy.spider import BaseSpider from scrapy.contrib.linkextractors.sgml importSgmlLinkExtractor from scrapy.selector imp

浏览 1提问于2013-06-01得票数 1

2回答

Scrapy搜索查询中的POST请求

、、、

以下是我试图帮助我的三个主要站点:鼠标与Python 1；；Scrapy.org 3import scrapy from

浏览 4提问于2016-03-23得票数 4

回答已采纳

2回答

如何在div中获取文本

、

看看这个网页： details = response.xpath('.//div[@class="detail"]/text()').extract()

浏览 1提问于2019-07-25得票数 1

2回答

如何不显示提取的链接和抓取的项目？

、、、、

我是新手，在windows中运行scrapy。如何避免在命令窗口中显示提取的链接和抓取的项目？我在这个链接上的"parse“部分找到了注释，不确定它是否相关，如果相关，应该如何应用。下面是部分代码的更多细节，从我的第二个Ajax请求开始(在第一个Ajax请求中，回调函数是"first_json_response"： def first

浏览 0提问于2013-12-14得票数 0

2回答

如何使用python抓取延迟加载映像

、、、

我想刮的站点已经启用了图像延迟加载，所以刮伤只能抓取100个图像中的10个，其余的都是placeholder.jpg。在Scrapy中处理延迟加载映像的最佳方法是什么？name = "massEffect"start_urls= [ 'file:/&#

浏览 2提问于2016-04-30得票数 3

回答已采纳

1回答

为什么Scrapy中的数据没有完全加载视图(响应)？

、

我正试着用Scrapy从Youtube上收集一些评论。但是，当我进入scrapy shell模式并使用view(response)打开它时，除了加载旋转器之外，我找不到任何注释。scrapy shell https://www.youtube.com/watch?v=kkl7-NzqxWo在注释部分显示无限旋转器。我怎样才能同时加载评论以便我可以刮掉它们呢？

浏览 1提问于2018-12-01得票数 0

回答已采纳

1回答

即使xpath在chrome.Why中是正确的，Scrapy shell也会给出一个空列表的输出？

、

在Scrapy shell上执行fetch(url)fetch(r) response.xpath@class='c1_t2i']/div[@class='c2prKC']/div&#

浏览 1提问于2020-07-24得票数 1

1回答

用ajax在主页上贴上刮痕请求

、、、、

该页面使用无限滚动，通过一个加载更多的按钮调用。使用开发人员工具的网络分析，如果单击此按钮，页面将向发送post请求。如果我将这个post请求复制为cURL，然后使用curl2scrapy进行转换，我将得到以下代码： request = Request

浏览 5提问于2021-04-20得票数 1

回答已采纳

1回答

如何通过抓取获取动态数据？

、、、、

大家好，我是新来的，我在解析其中一个网站时遇到了一些问题我需要模型名称，价格和链接到图片。我找到了所有的标题，除了价格，我几乎放弃了它。我找到了另一个链接'‘，但我不知道如何从其中刮取价格数据。import scrapyfrom scrapy.http import FormRequest, Requestcallback=self.parse) print(re

浏览 1提问于2020-04-05得票数 0

1回答

使用Scrapy延迟加载网页时出现问题

、、

然而，当我向下滚动页面时，页面的项目通过Ajax加载。到目前为止，我一直在尝试模拟实现这一点的POST请求，但没有成功。下面是描述我的问题的代码片段。import scrapy name = "eroski" pri

浏览 2提问于2016-03-21得票数 2

1回答

错误:错误处理{“产品名称”：[]，“产品图片”：[]，“产品价格”：[]}

、、

它在控制台日志中显示，IndexError: list索引超出了范围和错误:错误处理{“productname”：[]，“Product年间”：[]，“productprice”：[]}classproductspider(scrapy.Spider): start_urls = [47:51 [protego] DEBUG: Rule at line 82 without any user agent to enforce it

浏览 5提问于2022-02-18得票数 0

2回答

scrapy:如何捕捉返回具有部分html主体和状态200的响应的意外情况

在我的爬行过程中，一些页面返回一个带有部分html主体和状态200的响应，在我将响应体与我在浏览器中打开的响应体进行比较之后，前者遗漏了一些东西。如何在蜘蛛或下载中间件中捕捉到这种意外的部分响应体情况？

浏览 1提问于2014-07-09得票数 0

1回答

Scrapy/requests模拟XHR

、、、

我正在尝试从获取评论，当您单击更多评论时，我需要的AJAX请求似乎是。如何获得xhr post请求，以便正确解析所有数据？下面是我的代码：import scrapy url = 'https://www.tripadvisor.comChrome/56.0.2924.87 Safari/537.36',

浏览 1提问于2017-03-29得票数 0

2回答

无法使用刮伤认证fandromeda

、、

import scrapyfrom scrapy.http import Request, FormRequestfrom fandromeda.items import FandromedaItem class FandromedaC(CrawlSpider我注意到，在默认情况下，scrapy正在发出get请求而不

浏览 4提问于2016-12-01得票数 0

回答已采纳

1回答

通过python scrapy包获取响应

、、

我想在python中通过scrapy发送一个http请求，并在一个变量中获得响应。我不知道如何捕捉回复文本。from scrapy import Request "authority": "***", "user-agent": "Mozilla

浏览 14提问于2020-09-04得票数 1

2回答

我如何安排抓取蜘蛛在一定的时间后爬行？

、

我想安排我的蜘蛛在爬行完成后1小时内再次运行。在我的代码中，spider_closed方法是在爬行结束后调用的。现在，如何从这个方法再次运行爬行器。或者是否有任何可用的设置来调度抓取蜘蛛。import scrapyfrom a2i.items import A2iItemfrom scrapy.httpimport HtmlResponse fro

浏览 2提问于2016-06-19得票数 4

点击加载更多