将Anaconda-Scrapy作为Cron作业运行

Anaconda-Scrapy是一个强大的Python爬虫框架，可以用于抓取和提取互联网上的数据。将Anaconda-Scrapy作为Cron作业运行意味着将其设置为定时任务，定期自动运行爬虫程序。

Cron是一个在Unix和类Unix操作系统中用于定期执行任务的工具。通过使用Cron，可以在指定的时间间隔内自动运行脚本或程序。

将Anaconda-Scrapy作为Cron作业运行的步骤如下：

安装Anaconda：首先，需要安装Anaconda，它是一个用于科学计算和数据分析的Python发行版。可以从Anaconda官方网站（https://www.anaconda.com/products/individual）下载适合您操作系统的版本，并按照安装指南进行安装。
创建Scrapy项目：使用Anaconda的命令行工具（如Anaconda Prompt）创建一个新的Scrapy项目。可以使用以下命令创建一个名为myproject的项目：

scrapy startproject myproject

编写爬虫：进入项目目录，并使用任何文本编辑器编写爬虫代码。可以在myproject/spiders目录下创建一个新的Python文件，并定义一个继承自scrapy.Spider的类。在这个类中，可以定义爬虫的名称、起始URL、数据提取规则等。
测试爬虫：在编写完爬虫代码后，可以使用以下命令测试爬虫是否正常工作：

scrapy crawl spider_name

其中，spider_name是您在爬虫类中定义的名称。

设置Cron作业：使用Cron来定期运行爬虫。打开终端并输入以下命令来编辑Cron作业列表：

crontab -e

这将打开一个文本编辑器，其中包含Cron作业列表。在文件的末尾添加以下行来设置定时运行爬虫的作业：

/5 * * * cd /path/to/project && scrapy crawl spider_name

这将每5分钟运行一次爬虫。请确保将/path/to/project替换为您的项目路径，并将spider_name替换为您在爬虫类中定义的名称。

保存并退出编辑器。Cron将自动加载新的作业列表。

现在，您已经成功将Anaconda-Scrapy作为Cron作业运行。每当Cron作业触发时，爬虫将自动运行，并开始抓取和提取数据。这对于定期更新数据、监控网站变化或进行数据分析非常有用。

腾讯云提供了一系列与云计算相关的产品，其中包括云服务器、云数据库、云存储等。您可以根据具体需求选择适合的产品。详细的产品介绍和相关链接可以在腾讯云官方网站（https://cloud.tencent.com/）上找到。

页面内容是否对你有帮助？

有帮助

没帮助

将Anaconda-Scrapy作为Cron作业运行

、、、、

我正在尝试运行一个scrapy (与anaconda2一起安装)爬虫作为cron作业。到目前为止还没有发现。下面是cron命令：cron每隔1分钟运行一次(我检查了日志文件，看起来没问题)，下面是crawler_folder PATH=$PATH:/home/username/a

浏览 9提问于2017-07-18得票数 1

回答已采纳

1回答

Cron和Crouton (铬盒)

、、、

我无法让cron作业在运行Crouton的ASUS Chromebox上正常运行。我遵守了的指示。我编辑了/etc/rc.local cron<

浏览 3提问于2015-04-18得票数 1

4回答

自定义Laravel Artisan命令无法通过cron作业获得

、、、

我有自定义的Artisan命令，当我在SSH中运行时，这些命令可以在本地以及我的生产服务器上运行，但是对于任何cron作业都是不可用的。我甚至试着在用户运行cron作业时运行它，它在我的控制台上运行得很好。当我在上述设置中运行php artisan时，我的自定义命令将列出并可用。但是，当我将php artisan作为cron作业</em

浏览 4提问于2014-01-08得票数 4

回答已采纳

1回答

将端点作为cron作业运行

、

我有一个端点-- ，我想把这个端点作为cron运行在我的服务器上。我已经创建了一个获取作业命令，通过php运行。从docs中，它说我必须将命令的逻辑放在命令类的handle方法中。问题是，我是否需要将我的代码从我的控制器方法(具有端点逻辑)中移出，并将其放入我怀疑是正确的处理方法中，或者它们是将控制器方法调用到下面的方法的一种很好的方式。

浏览 3提问于2016-04-14得票数 2

回答已采纳

1回答

作为cron作业运行时node.js内存不足

、、

我编写了一些JavaScript代码，它在node.js下运行，可以将一个大文件(~20 MB)备份到Azure blob中。这在从bash shell运行时有效，但在以cron作业的形式运行时(在这两种情况下以根用户身份运行)，会出现以下错误：这大概意味着堆空间用完了，但是cron作业的限制设置在哪里呢？

浏览 6提问于2012-07-02得票数 0

1回答

Bash脚本可以手动运行，但是cron不能工作。+ Ubuntu 16.04

、、

然后，我创建了一个bash脚本，并添加了这个C程序，并期望以多个时间间隔运行。<><> 作为一个测试，我刚刚在一个shell脚本中尝试了两个命令

浏览 0提问于2018-12-20得票数 0

回答已采纳

1回答

更改无人值守更新的时间

我已经将无人参与的更新设置为每天在14.04服务器上运行。它在午夜由cron.daily和其他工作一起运行。我想改变无人参与的更新运行的时间，而不是其他的cron.daily作业。我尝试过将/etc/cron.day/apt迁移到其他地方，并将其作为单独的cron作业运行，但似乎没有运行。当我将它移回cron

浏览 0提问于2015-07-25得票数 0

2回答

包括文件到crontab配置？

我正在尝试将特定于项目的crontab配置放到代码存储库中，以便在部署时轻松地更新所有后端上的cron作业。是否可以将文件包含到crontab配置中？

浏览 0提问于2013-10-23得票数 10

2回答

使用表达式引擎脚本的Cron作业

、

我想知道是否有人对为在表达式引擎中运行的脚本设置cron作业的最佳方法有任何建议。目前，我的计划是使用cron作业通过Lynx访问URL。cron作业将加载URL，脚本将作为表达式引擎的一部分运行。运行这些脚本的理想方法似乎是让cron作业在内部运行PHP脚本，但此时我需要它在EE框架内运行，因此调用我的模块脚本将</

浏览 1提问于2011-03-01得票数 2

1回答

以非root用户身份运行python cron脚本

、、

我在我的CentOS 6机器中以特定用户帐户运行python脚本时遇到了一个小问题。我的cron.d/cronfile如下所示：帐户reportspython脚本甚至都没有开始运行！你知道为什么会这样吗？如果我在cronfile中将用户改为root而不是reports，它会运行得很

浏览 1提问于2013-08-09得票数 1

1回答

网站内容定期更新的模式？

、、

通常，这需要运行一个脚本来周期性地抓取/解析/操作一些数据，然后将其作为“静态”内容提供。有没有更好的方法来做这件事？

浏览 2提问于2010-07-20得票数 0

回答已采纳

2回答

如何在Hasura上创造cron职位？

、、

如何在Hasura上创建、部署、运行和管理？

浏览 5提问于2018-01-04得票数 4

回答已采纳

1回答

将自定义bash脚本设置为只作为sudo运行。

、、

我在一个命令中创建了一个脚本(文件名为update)来更新和升级。所有这些都是：sudo /usr/bin/apt-get update我使用了完整的路径，并将其放在自己的目录/home/user_name/custom_scripts中。我还确保将此目录指定为root，权限列为可执行脚本是：我

浏览 0提问于2017-08-23得票数 0

1回答

Wordpress crob工作表现

、、

我正在尝试创建一个插件，它将检查其他mysql表中的数据(S)(可能在与wordpress相同的数据库中，甚至在另一个主机中)，如果检查了新的数据，使用wp_insert_post或其他什么工具将它们作为帖子发布不，我想把支票工作作为wordpress的一项工作，每20分钟运行一次。我不知道这是不是正确的方法？它会给wordpress本身带来一些表现吗？另外，即使没有访客，也会触发钩编作业吗？

浏览 0提问于2016-11-03得票数 0

3回答

Cron执行问题

假设我用anacron或crontab -e设置了一个cron作业。我的机器一开就会执行作业吗？还是根本不执行？

浏览 0提问于2015-05-29得票数 3

回答已采纳

1回答

在多租户站点中发送大量电子邮件的最有效方式？

、

我使用作为我的邮件服务器，作为我的PHP代码。这是最有效的方法吗？我应该一次只发送一定数量的电子邮件吗？例如，每个cron作业100个？当我谈到cron作业的时候，cron作业可以在大腿上运行吗？因

浏览 1提问于2012-08-09得票数 1

1回答

python脚本的Cron执行不像预期的那样

、、、、

我有一个python脚本，由cron执行，它的目的是管理来自用户的消息给其他用户。这些消息存储在mongodb数据库中。如果我手动地执行python脚本，一切都很好，但是如果Cron运行它，用户将不会被更新，但是消息将被删除。mongodb服务器是2.4.10，我知道它很旧，但它是运行在raspberry pi 2 afaik上的最新版本。

浏览 3提问于2016-05-03得票数 0

1回答

python cronjobs中的捕获错误

、

我有一个python脚本作为cron作业，称为当脚本中发生错误时，cron作业将悄然失败。当我从命令行运行相同的命令时，我会得到一个堆栈跟踪。在作为cron作业运行时，如何将脚本输出堆栈跟踪(或将其写入文件)？我已经设置了MAILTO变量

浏览 0提问于2011-09-13得票数 2

回答已采纳

2回答

在amazon ec2上运行perl脚本

、、

我需要在我的EC2实例上运行Perl脚本。此脚本将从FTP客户端下载文件，然后将数据上载到EC2实例上的RDS数据库。脚本需要在特定的时间每天运行。现在，我在本地机器上有了脚本，而且它确实能工作。但是有没有办法将脚本本身上传到ec2上，这样脚本就可以在那里运行，我的PC机就不用运行了。

浏览 3提问于2014-04-28得票数 1

回答已采纳

1回答

被设置为在短时间内重复的php cron作业处理了多长时间？

、、、

我有一个php cron作业，需要每分钟运行一次。这项工作需要五到七分钟才能完成。这种类型的crons是如何管理的？它是中断前一个作业并开始作为新作业运行，还是启动与前一个作业并行的新作业？我是否应该将大任务分解为小任务，并将每个任务添加为不同的cron任务？

浏览 0提问于2015-10-28得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将Anaconda-Scrapy作为Cron作业运行

相关·内容

将Anaconda-Scrapy作为Cron作业运行

Cron和Crouton (铬盒)

自定义Laravel Artisan命令无法通过cron作业获得

将端点作为cron作业运行

作为cron作业运行时node.js内存不足

Bash脚本可以手动运行，但是cron不能工作。+ Ubuntu 16.04

更改无人值守更新的时间

包括文件到crontab配置？

使用表达式引擎脚本的Cron作业

以非root用户身份运行python cron脚本

网站内容定期更新的模式？

如何在Hasura上创造cron职位？

将自定义bash脚本设置为只作为sudo运行。

Wordpress crob工作表现

Cron执行问题

在多租户站点中发送大量电子邮件的最有效方式？

python脚本的Cron执行不像预期的那样

python cronjobs中的捕获错误

在amazon ec2上运行perl脚本

被设置为在短时间内重复的php cron作业处理了多长时间？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐