我正在尝试从https://www.ta.com/portfolio/business-services中使用scrapy抓取数据,但是响应为空。我正在寻找抓取href在div.tiles js-portfolio-tiles中使用代码response.css("div.tiles.js-portfolio-tiles a::attr(href)如何解压这个文件?website HTML
我是新手,在windows中运行scrapy。如何避免在命令窗口中显示提取的链接和抓取的项目?我在这个链接上的"parse“部分找到了注释,不确定它是否相关,如果相关,应该如何应用。下面是部分代码的更多细节,从我的第二个Ajax请求开始(在第一个Ajax请求中,回调函数是"first_json_response":
def first
它在控制台日志中显示,IndexError: list索引超出了范围和错误:错误处理{“productname”:[],“Product年间”:[],“productprice”:[]}classproductspider(scrapy.Spider): start_urls = [47:51 [protego] DEBUG: Rule at line 82 without any user agent to enforce it