首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一日一技:如何正确在 PyCharm 中调试 Scrapy 爬虫?

最近有不少同学在粉丝群里面问,如何调试Scrapy 爬虫。有些人不知道如何让 Scrapy 爬虫进入调试模式;还有一些人不知道怎么单步调试。...怎么进入调试模式 我们知道,Scrapy 项目要启动爬虫的时候,需要在终端或者 CMD 中执行一段命令scrapy crawl 爬虫名。...为了解决这个问题,我们可以在 Scrapy 项目的根目录创建一个 main.py文件,然后在里面写下如下一段代码: from scrapy.cmdline import execute execute...这个地方就像一个泥潭,无论你怎么跳出都跳不出来,始终无法回到你自己的代码中。你越是往外跳,PyCharm 就会打开越多的陌生文件,如下图所示: ? 遇到这种情况怎么办呢?...实际上非常简单,你注意观察在调试面板上,还有一个按钮,如下图箭头所指: ? 这个按钮的功能,是让 PyCharm 运行的代码,运行到你当前鼠标光标所在的位置再停下来。

3K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    为什么 strace 在 Docker 中不起作用?

    原因 1:在实验中,作为一个普通用户,我可以对我的用户运行的任何进程进行 strace。...容器进程是否在不同的用户命名空间中?嗯,在容器中: root@e27f594da870:/# ls /proc/$$/ns/user -l ......而 ptrace 在被 Docker 默认的 seccomp 配置文件阻止的系统调用列表中!(实际上,允许的系统调用列表是一个白名单,所以只是ptrace 不在默认的白名单中。...这很容易解释为什么 strace 在 Docker 容器中不能工作 —— 如果 ptrace 系统调用完全被屏蔽了,那么你当然不能调用它,strace 就会失败。...在 containerd 的 seccomp 实现中,在 contrib/seccomp/seccomp/seccomp_default.go 中,有一堆代码来确保如果一个进程有一个能力,那么它也会(通过

    6.4K30

    在Scrapy中如何使用aiohttp?

    特别是当你使用的是Scrapy,那么这个问题变得尤为麻烦。 我们一般在Scrapy的下载器中间件里面设置爬虫的代理,但问题来了,在下载器中间件里面,你怎么发起网络请求?...在Scrapy里面运行requests,会在requests等待请求的时候卡死整个Scrapy所有请求,从而拖慢整个爬虫的运行效率。...当然,你可以在Scrapy的爬虫里面,每次发起待爬请求前,先yield scrapy.Request('代理供应商网址'),请求一次代理供应商的网址,并在对应的回调函数里面拿到代理IP再发正常的请求。...实际上,我们可以在Scrapy里面,使用aiohttp,这样既能拿到代理IP,又能不阻塞整个爬虫。...在等待第一页返回的过程中,第二个延迟请求完成并返回,于是Scrapy去请求正式网址的第二页…… 总之,从Scrapy打印出的信息可以看出,现在Scrapy与aiohttp协同工作,异步机制正常运转。

    6.5K20

    在pycharm中安装pip_pycharm安装django

    总的来说,个人很喜欢Python的语言风格,但是这门语言对于windows并不算很友好,因为如果是初学者在windows环境下安装,简直是折磨人,会遇到各种蛋疼的情况。...在安装完成之后,打开控制台,输入“Python”,我们能够看到下面的效果: 原因很简单,是因为python.exe文件在 Python 目录下,我们还没有设置环境变量。...所以我们需要手动添加环境变量:鼠标右键我的电脑 -> 属性 -> 点击高级系统设置 -> 点击环境变量 -> 点击PATH -> 在最后面加上我们的Python安装路径 -> 点击确定。...在这个过程中需要注意的问题是,添加PATH路径的时候,要在最后面添加一个分号。现在我们再次在浏览器里面输入“Python”,就能直接在控制台出入命令了: 第二步,我们安装pip。...按照之前介绍的添加环境变量的方法,我们在PATH最后添加: C:\Python34\Scripts; 到现在我们才算完整安装好了pip: 第三步,安装一些Python的包,比如Tornado这个web

    88340

    在pycharm中写代码_pycharm运行部分代码

    在 PyCharm 中,你可以在「项目」中执行任意操作。因此,首先你需要创建一个项目。 安装和打开 PyCharm 后,你会看到欢迎页面。...选择后,指定环境位置,从 Python 解释器列表中选择要安装在系统中的 base interpreter。通常,保持默认设置即可。...点击右下角的「Create」,创建新项目: 屏幕上出现「Tip of the Day」弹窗,在每次启动时 PyCharm 通过该弹窗提供 trick。关掉该弹窗。...你将看到如下 PyCharm 窗口: 至于测试代码,我们来快速写一个简单的猜谜游戏,即程序选择一个数字让用户来猜,在每一次猜测时,程序将告诉用户他猜的数字比神秘数字大还是小,用户猜中数字时游戏结束。...此外,如果你在条件句前忘记键入 if,在该句子最后增添.if 并点击 Tab 键,PyCharm 将修复该 if 条件句。该用法同样适用于 True.while。

    1.4K20

    在Java中调用Python

    恰好我在项目中就遇到了这个问题,需要在Java程序中调用Python程序。...关于在Java中调用Python程序的实现,根据不同的用途可以使用多种不同的方法,在这里就将在Java中调用Python程序的方式做一个总结。...中通过Runtime调用Python程序与直接执行Python程序的效果是一样的,可以在Python中读取传递的参数,也可以在Java中读取到Python的执行结果。...使用Jython能做什么 既然Jython是Python语言在Java平台的实现,是Java语言实现的,那么是否可以在Jython程序中调用Java,在Java中也能调用Jython呢?...,也是在Java中调用Python程序最常见的用法:Python程序可以实现Java接口,在Python中也可以调用Java方法。

    5.1K30

    在anaconda中安装pycharm_anaconda和pycharm关联

    方式一:使用pip在命令窗口(cmd)安装 注意:这种情况下要确保Anaconda的路径已经添加到系统的环境变量中,否则有可能识别不了安装的命令 1.1 安装 ①点击win+r输入cmd调出命令窗口来:...②接着在窗口输入安装命令即可,我一般会用豆瓣源,这样安装快点,下面 注意:如果你创建了不同的环境在安装之前需要先输入: activate 环境名 这样才能确保你安装到了对应的环境中,有很多人会出现安装对应包之后还会提示没有这个包的问题...,这很有可能是你没有安装到当前工程文件使用的环境中,这也是为什么推荐使用Anaconda的原因,它可以创建指定python版本的环境,在安装python包时把对应环境激活即可正常安装调用。.../simple --trusted-host pypi.douban.com 四、在Anaconda中创建不同的环境以供pycharm选择 ①重复【三】中方式【2】的步骤【①】【②】,把Anaconda...安装文件下的【envs】文件夹里就能看到自己有哪些环境了 可以看到这个就是刚刚创建的pytorch环境了,如果在pycharm编程时想要使用这个环境,在重复【二】中的步骤,在步骤【⑥】中选择Anaconda

    1.9K40
    领券