腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
如何
修复
这个
用
木偶人
制作
的
网络
爬行
器
,
它在
抓取
一半
数据
后
什么
也
不做
,
但
没有
给出
任何
错误
?
、
、
、
为了
我
的
大学项目,
我
用
nodejs和puppeteer做了一个维基百科
的
刮板。除了一个链接之外,它对所有的链接都有效。在
抓取
了该页面中表
的
几乎
一半
的
数据
之后(
我
正在使用console.log查看当时哪些
数据
被
抓取
了),它
什么
也
不做
。它不会显示
任何
错误
。它不会停止执行,只是在那
浏览 7
提问于2019-03-02
得票数 0
回答已采纳
2
回答
是否需要为每个目标站点编写
抓取
器
?
、
、
、
、
我
是个刮东西
的
新手。
我
写了一个 刮板 它将擦伤 Maplin 商店。
我
使用Python语言和BeautifulSoup来
抓取
存储。
我
想问
的
是,如果
我
需要清理一些其他
的
eCommerce商店(比如亚马逊、Flipkart),
我
是否需要定制
我
的
代码,因为它们具有不同
的
HTML ( 和 名字是不同
的
,另外还有其他东西)。所以,
我
写<e
浏览 40
提问于2014-12-28
得票数 7
回答已采纳
8
回答
关于
抓取
整个
网络
的
指南?
我
刚刚有了
这个
想法,想知道是否有可能
爬行
整个
网络
(就像大男孩一样!)在单个专用服务
器
上(如Core2Duo,8G内存,750 on磁盘100 like)。
我
曾经读过一篇论文,题目是done....but,
我
想不起来这篇论文
的
标题了。这就像是在一台专用服务
器
上使用某种统计模型
抓取
整个
网络
。无论
如何
,想象一下从大约10,000个种子URL开始,然后进行详尽
的
爬
浏览 2
提问于2010-01-17
得票数 36
回答已采纳
3
回答
网络
抓取
是否合法?
我
想刮,一个网站,有他们所有的商店
的
联系方式在他们
的
网页,
我
可以手动记下,所以刮该网站是合法
的
或非法
的
。
浏览 3
提问于2021-09-01
得票数 3
2
回答
"TypeError:'int‘对象不可迭代“,但
它在
我
的
其他代码中工作得很好
、
、
、
、
我
正在尝试从中
抓取
数据
,
但
遇到了一些困难。
我
在过去通过
网络
抓取
创建csvs时
也
设置了一些类似的程序,
但
这个
程序给我带来了一些麻烦。
我
一直在一个特定
的
for循环中得到一个TypeError,但我有一个本质上相同代码
的
不同程序工作得很好。
我
确信有一个简单
的
方法可以解决
这个
问题,但我一直找不到。
我
已
浏览 0
提问于2019-10-26
得票数 0
1
回答
爬虫数百万条记录时堆内存不足
、
、
我
正在做一些api来爬虫从许多来源(与数百万条记录),但我有问题涉及到内存不足。
我
用
谷歌搜索了一下,找到了一些资源,
但
没有
解决
我
的
问题。
没有
解决
我
的
问题
的
function getContent() { array.forEachasync.pa
浏览 6
提问于2017-06-16
得票数 0
回答已采纳
3
回答
搜索引擎从哪里开始
爬行
?
搜索引擎机器人使用
什么
作为起点?是DNS查找,还是从一些固定
的
知名站点列表开始?有
什么
猜测或建议吗?
浏览 1
提问于2008-09-03
得票数 12
回答已采纳
1
回答
php脚本停止执行,不显示
任何
错误
、
、
、
我
有一个
抓取
网页
的
php脚本,并将
抓取
的
数据
插入到
数据
库中。有时,在脚本运行很长时间
后
,php脚本就会停止执行,不会显示
任何
错误
。ini_set('display_errors',1);但是在php脚本停止执行
后
,
我
没有
得到<e
浏览 2
提问于2014-12-10
得票数 0
1
回答
用
Soup
抓取
JS元素是行不通
的
、
、
、
、
我
正在尝试使用
这个
github中
的
python
网络
爬行
器
,但是自从
这个
爬行
器
被编写
后
,网站发生了轻微
的
变化,所以它不能工作,
我
不知道为
什么
。')[5].get_text()
没有
从
这个
网页(https://bitinfocharts.com/comparison/transact
浏览 25
提问于2020-12-22
得票数 0
4
回答
让
我
的
小蜘蛛停止
爬行
、
当特定
的
if条件为真(如scrap_item_id == predefine_value )时,是否有机会停止爬网。
我
的
问题类似于,但我想“强制”
我
的
抓取
蜘蛛在发现最后一个
抓取
的
项目
后
停止
爬行
。
浏览 0
提问于2010-12-15
得票数 35
2
回答
If语句仅将新值写入Scrapy中
的
PostgreSQL db
、
、
、
、
我
有一个
抓取
的
爬行
器
,它使用psycopg2将
抓取
的
数据
写入PostgreSQL
数据
库。
我
有Scrapyd运行和项目导出
器
,一切都设置得很好。
我
正在
抓取
craigslist
的
劳动部分,查找帖子
的
url、标题和创建日期。
我
想在新帖子上创建通知,因此为了实现这一点,
我
将PostgreSQL
浏览 33
提问于2019-08-20
得票数 0
回答已采纳
13
回答
在“潜入python”之后会发生
什么
?
我
一直想学一门比java更好
的
语言。所以我开始尝试使用python。
我
已经读过了“潜入python”,所以我现在对python有了一个不错
的
了解。
我
听说python很适合
网络
爬行
,但是
我
在dive into python中
没有
看到这一点。社区可以建议
如何</
浏览 2
提问于2009-07-08
得票数 10
1
回答
如何
为Flash做一个合适
的
Haxe预加载
器
,或者你认为最好
的
方法是
什么
?
、
、
、
我
最近开始
用
Haxe开发一个游戏,它
的
目标是Flash平台。
我
可以说
我
真的不太习惯Flash以及它是
如何
工作
的
,很明显它是为动画设计
的
。但不管怎样,现在
我
正在
制作
的
游戏已经开始变得很大,它需要几秒钟
的
时间才能加载,所以我想有一个很好
的
预加载
器
,在用户等待
的
时候给人一个好
的
印象。
我
找到了
浏览 1
提问于2010-10-10
得票数 2
回答已采纳
1
回答
抓取
后
的
网站
错误
、
我
制作
了一个简单
的
刮刀,它可以访问一张专辑,并为azlyrics.com
的
每首歌刮歌词。铬:
我
的
家庭
网络</e
浏览 1
提问于2017-02-02
得票数 2
2
回答
Swift NSURLConnection立即返回一个1005
错误
、
、
我
正在编写一个新
的
应用程序,
我
看到这条
错误
信息到处乱发,上面写着:重启模拟
器
。不幸
的
是,在
我
的
例子中,这似乎不是答案,
用
objective编写
的
老应用程序似乎使用
的
方法完全相同,
但
当我对Api (我们
的
)进行NSUrlConnection调用时,它似乎不适用于新
的
应用程序。响应是一个适当
的
200与一些json
数据</em
浏览 8
提问于2015-03-31
得票数 1
回答已采纳
1
回答
Wi只加载网站,
没有
其他内容。
、
事实上,
我
现在正在
我
的
电脑上写
这个
。点击一个网站失败,玩游戏失败,流媒体音乐失败。问题是,我家里
的
所有其他设备在同一个
网络
上都可以很好地使用互联网,所以,看看我
的
电脑发生了
什么
事。
我
尝试过编辑
我
的
DNS到谷歌和OpenDNS
的
服务
器
。
我
从
这个
网站上跟踪了很多指南,比如sudo iptables -F和sudo dhclient
浏览 0
提问于2021-05-15
得票数 0
2
回答
JSONObject类有问题,未
给出
错误
、
我
正在构建一个小API,
我
将调用它并接收有关目录
的
JSON
数据
。
它在
我
的
dev box上运行得很好,但是当我把它放到我需要它
的
服务
器
上时,
它在
应用程序中运行了
一半
,然后就停止了。
没有
抛出异常,控制台输出
不做
任何
事情,
我
也
没有
从GET请求中收到对服务
器
的
响应。插件就会停止。 这
浏览 0
提问于2013-11-18
得票数 0
2
回答
如何
取消windows服务
器
2003
修复
安装?
、
、
、
运行chkdsk,它似乎
修复
磁盘
错误
并允许访问ntds.dit文件,
但
esentutl仍然失败。(将驱动
器
附加到另一台服务
器
以运行esentutl)访问源
数据
库“
的
复制路径/ntds.dit”失败,Jet 1022。操作在0.170秒
后
以
错误
终止-1022 (JET_errDiskIO,磁盘IO
错误
). 此
错误
发生在
我
将文件复制到包含C:\WI
浏览 0
提问于2010-03-05
得票数 0
5
回答
如何
以编程方式捕获具有强制更新
的
网页
、
、
我
需要捕获一个网站,并寻找一个适当
的
库或程序来做这件事。该网站使用Java脚本和推送更新到页面,
我
需要捕获这些以及页面本身。
我
使用curl来捕获页面本身,但我不知道
如何
捕获更新。
浏览 0
提问于2008-12-27
得票数 2
回答已采纳
1
回答
Qt静态链接调用gstreamer函数
、
、
、
我
用
Qt为另一个应用程序写了一个库(一个插件)。在
这个
库中,
我
使用gstreamer来解码音频/视频
数据
。直到今天,
我
还在使用动态链接Qt。现在
我
尝试链接Qt static (编译,添加Qt-Creator,
制作
并使用新
的
工具包)。编译工作正常,
但
gstreamer
什么
也
不做
。
我
没有
更改项目文件中
的
<
浏览 4
提问于2015-12-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
scrapy官方文档提供的常见使用问题
网站优化如何选择老域名快速增加收录?老域名选择有何技巧?
这个曾领先于谷歌和微软的开源项目,为何盛极而衰?
QQ/TIM存在升级漏洞 被植入病毒推送给用户
做SEO,你不能不知道的搜索引擎工作原理,因为
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券