Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >scrapy如何顺序执行多个爬虫

scrapy如何顺序执行多个爬虫

作者头像
企鹅号小编
发布于 2018-01-29 08:38:34
发布于 2018-01-29 08:38:34
2.2K0
举报
文章被收录于专栏:大数据大数据

scrapy如何单线程顺序执行多个爬虫,刚开始我天真的以为将多个excute顺序罗列就能依次执行每个爬虫了,代码如下所示:

谁料,在执行完第一个爬虫之后,整个程序就停止运行了。到底是什么原因呢?笔者在 Stack Overflow 上找到了类似的问题( https://stackoverflow.com/questions/24875280/scrapy-cmdline-execute-stops-script )。得知问题的原因在于 方法中的最后一句代码是 ,所以当程序执行完一个execute语句后便停止了。

那么,这个问题该如何解决呢?

思路1:测试 能不能执行多个命令,即在 方法中设置多个参数,或用列表的形式将多个命令组合在一起进行执行。--经测试,不行!

思路2:既然 可以执行一条 命令,那么在 中有没有类似 的命令,它可以执行一个由多条命令组合在一起的列表命令集呢。--经测试,不行!

思路3:寻找可以替换 的命令,只要能执行命令即可。

方法一: (这也是我所遇到的最简单方法)

下面的两种方法,笔者并没有尝试成功,暂时写在这里,有待进一步研究。

方法二:

方法三:

拓展:如何实现多个爬虫循环顺序爬取

首先设置一个循环,接着为每一个爬虫设置一个定时器,让每一个爬虫爬虫一段时间,再运行下一个爬虫即可。具体代码如下,此处设置每一个爬虫运行3600秒

作者:高正杰

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

本文来自企鹅号 - Python热爱着媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - Python热爱着媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Scrapy框架快速入门,以糗事百科为例进行说明【python爬虫入门进阶】(16)
Scrapy框架是一个为了爬取网站数据,提取结构性数据而编写的应用框架,也就是说应用Scrapy框架的话,我们就不需要从零开始写一个爬虫项目。
码农飞哥
2022/03/31
5760
Scrapy框架快速入门,以糗事百科为例进行说明【python爬虫入门进阶】(16)
Scrapy框架的使用
Scrapy是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 [1]
北山啦
2022/11/27
5670
Python爬虫:Scrapy 框架快速入门及实战演练
今天来介绍一下 Python 的一个爬虫框架Scrapy ,类似的还有 Portia Crawley。
wsuo
2020/07/31
1.2K3
Python爬虫:Scrapy 框架快速入门及实战演练
精通Python爬虫框架Scrapy_爬虫经典案例
Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试.
全栈程序员站长
2022/08/03
8700
精通Python爬虫框架Scrapy_爬虫经典案例
Python之Scrapy爬虫代理的配置与调试
在调试爬虫的时候,新手都会遇到关于ip的错误,好好的程序突然报错了,怎么解决,关于ip访问的错误其实很好解决,但是怎么知道解决好了呢?怎么确定是代理ip的问题呢?由于笔者主修语言是Java,所以有些解释可能和Python大佬们的解释不一样,因为我是从Java 的角度看Python。这样也便于Java开发人员阅读理解。
蒋老湿
2020/05/25
9490
Python之Scrapy爬虫代理的配置与调试
用scrapy爬虫抓取慕课网课程数据详细步骤
关于如何安装scrapy框架,可以参考这篇文章 史上最完全Mac安装Scrapy指南 http://www.jianshu.com/p/a03aab073a35 超简单Windows安装Scrapy (仅需一步) http://www.cnblogs.com/lfoder/p/6565088.html 这里使用的是Python2.7 例子的目标就是抓取慕课网的课程信息 流程分析 抓取内容 例子要抓取这个网页http://www.imooc.com/course/list 要抓取的内容是全部的课
机器学习AI算法工程
2018/03/15
2.1K0
用scrapy爬虫抓取慕课网课程数据详细步骤
干货!爬虫框架 Feapder 和 Scrapy 的对比分析
scrapy 自带的重试中间件只支持请求重试,解析函数内异常或者数据入库异常不会重试,但爬虫在请求数据时,往往会有一些意想不到的页面返回来,若我们解析异常了,这条任务岂不是丢了。
崔庆才
2021/10/08
2.5K0
干货!爬虫框架 Feapder 和 Scrapy 的对比分析
实战 | 如何利用 Scrapy 编写一个完整的爬虫!
提到爬虫框架,这里不得不提 Scrapy,它是一款非常强大的分布式异步爬虫框架,更加适用于企业级的爬虫!
AirPython
2022/12/29
7030
实战 | 如何利用 Scrapy 编写一个完整的爬虫!
Python3使用Scrapy快速构建第一款爬虫
前言 最近因为想要构建自己的应用程序,所以需要用到爬虫,然后就开始了爬虫的鼓捣和学习。为了让大家更快的入门一款爬虫,为大家讲解一下scrapy的基本原理,和快速上手使用,爬取的页面是伯乐在线,大家可以去提前熟悉一下。 环境搭建 操作系统:WIN10 IDE: 使用的是全家桶Pycharm 1. 全局安装scrapy pip install scrapy -g 2. 创建一个存放项目的文件夹 mkdir Spider-Python3 3. 创建scrapy工程 scrapy startproject Arti
十里桃花舞丶
2018/05/17
6610
scrapy顺序执行多个爬虫
# -*- coding:utf-8 -*- from scrapy import cmdline from scrapy.cmdline import execute import sys,time,os #会全部执行爬虫程序 os.system('scrapy crawl ccdi') os.system('scrapy crawl ccxi') #----------------------------------------------------- #只会执行第一个 cmdline.exe
周小董
2019/03/25
1.1K0
【Python爬虫Scrapy框架】一、Scrapy爬虫框架的入门案例「建议收藏」
项目生成的位置是自己可以控制的,比如我是把项目放在了D盘的scrapy_test这个文件夹。
全栈程序员站长
2022/09/13
1.6K0
从原理到实战,一份详实的 Scrapy 爬虫教程
本文将从原理到实战带领大家入门另一个强大的框架 Scrapy。如果对Scrapy感兴趣的话,不妨跟随本文动手做一遍!
CDA数据分析师
2021/08/05
11.2K0
从原理到实战,一份详实的 Scrapy 爬虫教程
Scrapy源码(2)——爬虫开始的地方
Scrapy运行命令 一般来说,运行Scrapy项目的写法有,(这里不考虑从脚本运行Scrapy) Usage examples: $ scrapy crawl myspider [ ... myspider starts crawling ... ] $ scrapy runspider myspider.py [ ... spider starts crawling ... ] 但是更好的写法是,新建一个Python文件,如下,(便于调试) from scrapy import cmdline c
小歪
2018/04/04
1K0
Scrapy源码(2)——爬虫开始的地方
一个Scrapy项目下的多个爬虫如何同时运行?
此时,这个命令行窗口在爬虫结束之前,会一直有数据流动,无法再输入新的命令。如果要运行另一个爬虫,必须另外开一个命令行窗口。
青南
2020/07/16
2.8K0
Scrapy源码剖析(二)Scrapy是如何运行起来的?
在上篇文章:Scrapy源码剖析(一)架构概览,我们主要从整体上了解了 Scrapy 的架构和数据流转,并没有深入分析每个模块。从这篇文章开始,我将带你详细剖析 Scrapy 的运行原理。
_Kaito
2021/03/23
1.1K0
Scrapy源码剖析(二)Scrapy是如何运行起来的?
python scrapy实战糗事百科保
编写qsbk_spider.py爬虫文件 # -*- coding: utf-8 -*- import scrapy from qsbk.items import QsbkItem from scrapy.http.response.html import HtmlResponse from scrapy.selector.unified import SelectorList class QsbkSpiderSpider(scrapy.Spider): name = 'qsbk_spider'
py3study
2020/01/20
4270
Scrapy快速入门
要使用Scrapy框架创建项目,需要通过命令来创建。首先进入到你想把这个项目存放的目录。然后使用以下命令创建:
用户2200417
2022/03/09
2980
python爬虫架构之scrapy重现江湖
scrapy是一个python爬虫架构,非常适合做一些大型爬虫项目,并且开发者利用这个架构,可以用不关注一些细节问题,现在爬虫的架构还是很多的,作为元老级别的scrapy依然是一个受到多方关注的技术。
数据森麟
2019/11/05
7770
python爬虫架构之scrapy重现江湖
Python自动化开发学习-Scrapy
讲师博客:https://www.cnblogs.com/wupeiqi/p/6229292.html 中文资料(有示例参考):http://www.scrapyd.cn/doc/
py3study
2020/01/08
1.6K0
Scrapy入门到放弃02:了解整体架构,开发一个程序
Scrapy开门篇写了一些纯理论知识,这第二篇就要直奔主题了。先来讲讲Scrapy的架构,并从零开始开发一个Scrapy爬虫程序。
叫我阿柒啊
2022/05/09
6220
Scrapy入门到放弃02:了解整体架构,开发一个程序
推荐阅读
相关推荐
Scrapy框架快速入门,以糗事百科为例进行说明【python爬虫入门进阶】(16)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档