腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Scrapy
API
的
简单
抓取
器
我正在
使用
Scrapy
在一个更大
的
项目中编写一个刮板,并且我试图使它尽可能地最小化(而不是创建一个完整
的
scrapy
项目)。这段代码正确地下载了一个URL: import
scrapy
""" https://docs.
s
浏览 12
提问于2021-01-26
得票数 0
1
回答
并发发送HTTP请求
、
、
我希望向
API
端点发送100K-300K
的
POST请求-这些请求来自我正在迭代
的
JSON对象列表。不幸
的
是,我能
使用
的
最大区块大小是一次10个事件,这大大降低了发送所有我想要
的
事件
的
速度。
api
_key=" +
api
_key + "&event=" + str_event print r.con
浏览 12
提问于2016-08-18
得票数 1
1
回答
Scrappy选择
器
上
的
Scrappy迭代
、
、
、
、
我正在尝试
抓取
一个
使用
调用HTML
的
API
的
网站,因此为此,我需要
抓取
API
,然后从
API
抓取
HTML结果 我已经
使用
这篇文章设法获得了
API
响应,并从中获得了HTML。resp = json.loads(response.text) selector=
scrapy
.Selector(text=resp['results'], type="html&
浏览 10
提问于2020-12-16
得票数 1
9
回答
BeautifulSoup和
Scrapy
crawler有什么区别?
、
、
、
我想做一个网站,显示亚马逊和易趣产品价格
的
比较。其中哪一个会工作得更好?为什么?我对BeautifulSoup比较熟悉,但对
Scrapy
crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
2
回答
如何
使用
scrapy
抓取
instagram查询?
、
、
、
我现在正在尝试
抓取
instagram帖子查询
的
纯文本(""),但只得到了403和301个回复。有人知道我如何绕过这些响应或
抓取
数据吗?
浏览 3
提问于2018-05-06
得票数 1
1
回答
在PyQt4主循环中集成
抓取
/扭曲事件循环
、
、
、
我正在开发一个PyQt4工具,这是
使用
抓取
网站
抓取
。我启动了一个新
的
进程多进程,以便从ui运行
Scrapy
爬行
器
。一切正常~ ui是阻塞
的
,
Scrapy
是
抓取
的
。我希望有一个非阻塞
的
ui,尽管我希望在PyQt主循环中集成Twisted事件循环。 有没有人知道如何尽可能
简单
地实现这一点?我不熟悉
Scrapy
/ PyQt / Multiproce
浏览 2
提问于2013-02-24
得票数 1
回答已采纳
3
回答
如何在
Scrapy
中
的
同一进程中运行多个爬行
器
、
、
我是Python &
Scrapy
的
初学者。我刚刚创建了一个带有多个爬虫
的
Scrapy
项目,在运行"
scrapy
crawl ..“它只运行第一个爬虫。提前谢谢。
浏览 0
提问于2014-04-11
得票数 2
1
回答
如何刮这个数据库站点?
、
、
、
我尝试过
使用
普通
的
html
抓取
,但我目前对刮刮不太熟悉。
浏览 9
提问于2022-12-02
得票数 0
1
回答
如何
使用
Scrapy
更新价格
、
、
、
、
我正在开发价格下降通知应用程序,我正在考虑
使用
Scrapy
,但是,我不确定如何
使用
它,我是否需要在特定间隔后定期检查产品价格,或者有任何其他方法来做到这一点。
浏览 2
提问于2021-06-13
得票数 0
2
回答
将
scrapy
爬虫构建到我自己
的
程序中,我不想从命令行调用
scrapy
)
、
、
与这个问题类似:我可以在python ok中
使用
mongoDB,我已经可以构建包含爬虫
的
抓取
项目,但现在只是将它们合并到一个应用程序中。我想运行一次应用程序,并且能够从我自己
的
程序中控制多
浏览 0
提问于2012-06-28
得票数 8
回答已采纳
1
回答
Scrapy
crawlera身份验证问题
、
、
、
、
我一直在尝试
使用
scrapy
-crawlera作为
使用
scrapy
抓取
一些数据
的
代理。我在settings.py中添加了以下行:CRAWLERA_ENABLED= True 在新更改<e
浏览 10
提问于2021-03-09
得票数 1
2
回答
Python
Scrapy
-如何同时从2个不同
的
网站
抓取
?
、
我需要从Excel中给出
的
域列表中
抓取
数据;问题是我需要从原始网站(让我们举个例子:)和从similartech ()
抓取
数据。我希望它们同时被
抓取
,这样我就可以接收它们,并在最后格式化它们一次,之后我将直接转到下一个域。 理论上,我应该在
scrapy
中以异步方式
使用
2个爬行
器
?
浏览 2
提问于2020-02-10
得票数 1
1
回答
如何
使用
Scrapy
自动获取请求头?
、
我们知道,在浏览
器
中,可以查看->网络-> XHR -> Headers和get Request Header。然后可以将这些标头添加到
Scrapy
请求中。但是,有没有一种方法可以
使用
Scrapy
请求自动获取这些请求头,而不是手动获取?我尝试
使用
:response.request.headers,但此信息还不够: {b'Accept': [b'text/html,application/xhtml+xml,application/
浏览 50
提问于2021-05-21
得票数 0
回答已采纳
1
回答
尝试在网站上
抓取
google地图
api
生成
的
动态数据,但正常
抓取
返回空白
、
、
、
、
我正在
使用
scrapy
从这个中
抓取
作业数据。一个作业页面看起来像。静态数据可以很容易地被
scrapy
抓取
,但是google地图apis生成
的
动态数据,如“距离”和“时间”,给我带来了问题。当我在chrome中打开控制台,然后在脚本部分
的
网络选项卡中,我可以看到一个对googles map
api
发出
的
java请求("DirectionsService.Route"),所有我需要
的
值都是JSON格式
浏览 1
提问于2015-02-05
得票数 0
1
回答
在python中浏览/解析html页面
、
、
、
、
为了与html页面进行交互,我试图把一些我需要
的
插件集合在一起。我需要
的
范围从
简单
的
浏览和与按钮或网页链接(如“在这个文本框中写一些文本并按这个按钮”)进行交互,到解析html页面和向服务
器
发送自定义get/post消息。我正在
使用
Python3,到目前为止,我有Request用于
简单
的
网页加载、自定义get和post消息,BeautifulSoup用于解析HTML树,我正在考虑尝试机械化来进行
简单
的
网页交
浏览 3
提问于2014-04-17
得票数 1
回答已采纳
1
回答
Scrapy
有物品限制吗?
、
、
、
、
在那些日子里,我用Python用
Scrapy
制作了一个蜘蛛。它基本上是一个
简单
爬行
器
类,用于对Html页面中
的
某些字段进行
简单
的
解析。我不
使用
starts_url[]
Scrapy
字段,但我
使用
如下
的
个性化列表:def __init__(self, url, data):
浏览 3
提问于2015-10-16
得票数 0
1
回答
HTML
抓取
-如何在yelp商业页面中找到商业类别?
、
、
我不想
使用
API
,我希望
抓取
一个HTML页面并提取这些数据。
浏览 0
提问于2015-07-21
得票数 1
7
回答
用本地系统中保存
的
html
抓取
文件
、
例如,我有一个站点"www.example.com",实际上我想通过保存到本地系统来
抓取
这个站点
的
html。parse(self, response): hxs = HtmlXPathSelector(response)最后,我
的
意图是
抓取
保存在本地系统中
的
浏览 0
提问于2012-06-05
得票数 31
1
回答
使用
Scrapy
和Python
抓取
JS生成
的
内容
、
有一个网页是用JS:生成
的
默认情况下,
scrapy
只获取超文本标记语言,而不执行JS。我怎样才能改变它?
浏览 14
提问于2018-01-16
得票数 0
回答已采纳
3
回答
用python刮网站
、
、
、
、
我已经看过多个教程和博客,最常见
的
库是漂亮汤和
scrapy
。如果有一种方法可以在不
使用
任何第三方库(如beautifulsoup和
scrapy
)
的
情况下
抓取
一个网站,那么就可以
使用
beautifulsoup。
浏览 1
提问于2020-06-09
得票数 1
回答已采纳
点击加载更多
相关
资讯
Python爬虫:使用scrapy框架抓取360超清壁纸
Scrapy框架的使用之Scrapy入门
码以致用02-用Scrapy 爬虫抓取简单心理咨询师资料
Scrapy框架的使用之Scrapy通用爬虫
云立方丨提升scrapy的抓取效率方法有哪些
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券