腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
网站
爬行自动检测
是否可以编写代码来检测
网站
是否正在
爬
取
内容?
浏览 1
提问于2009-04-08
得票数 1
4
回答
将asp.net动态站点转换为静态站点的工具
、
有没有什么工具可以
爬
取
asp.net
网站
并创建一个静态站点?
浏览 2
提问于2008-09-04
得票数 0
回答已采纳
1
回答
为什么谷歌机器人不能抓取这个robots.txt?
、
、
我不明白为什么谷歌机器人不能抓取和索引我创建的WordPress
网站
。这就是我的robots.txt:Disallow: /wp-admin/Disallow: /wp-login.
php
Disallow
浏览 1
提问于2014-11-24
得票数 0
2
回答
Scrapy没有拿起我的url
、
、
我有一个破烂的代码,应该能够采取电话和地址从一个网页中的表格: name="People" 'http://canada411.yellowpages.ca/search/si/1/519-896-7080/', def parse(self,response): yield
浏览 0
提问于2017-02-16
得票数 0
1
回答
怎样在不使用API的前提下
爬
取
Twitter数据?
、
、
、
、
由于现在Twitter API 数据
爬
取
付费,所以我想在不使用Twitter API的情况下使用python
爬
取到特定关键词的Twitter数据或者Reddit数据,有什么好办法吗?
浏览 546
提问于2024-01-06
1
回答
如何使搜索引擎不读取.
php
扩展urls
、
、
我如何才能限制搜索引擎不读取我们的.
php
url,因为我们希望我们干净的url出现在搜索引擎中。我使用htaccess文件从所有的urls中删除.
php
,但是搜索引擎同时使用了这两个urls,即使用.
php
和不使用.
php
。 我想让搜索引擎只读没有.
php
扩展名的urls。
浏览 7
提问于2015-12-15
得票数 0
2
回答
HTML爬行到ePub的转换工具
、
、
目前似乎还没有工具可用于
爬
取
站点并将内容转换为ePub格式。我认为,在没有得到
网站
所有者明确同意的情况下,在
网站
上执行这一行动是有法律含义的。
浏览 2
提问于2011-05-08
得票数 1
回答已采纳
1
回答
如何隐藏我的IP在python中进行网络抓取?
、
、
、
我正在用python在一些页面上做web抓取,我已经被其中的一些阻止了。当我试图通过TOR浏览器检查它时,我已经看到我无法访问页面,所以我认为这些页面已经能够跟踪我所有的IP或我没有很好地配置TOR (我认为不是因为我用Chrome和TOR检查了我的IP地址和TOR是不同的),所以,有人知道为什么吗?谢谢!
浏览 19
提问于2020-05-21
得票数 2
回答已采纳
0
回答
为什么用xpath提取数据保存到数据库会带有<span class="title">xxxx</span>这样的html标签?
、
、
、
、
我的本意是只想
爬
取
xxxxx,为何标签也被
爬
取了呢 图片
浏览 60
提问于2023-08-23
2
回答
使用机械化来检索
网站
的所有链接
、
、
、
如何使用Mechanize库查找
网站
上的所有链接? 我喜欢递归地解析内部链接,以便抓取一个
网站
的所有链接。
浏览 0
提问于2012-07-23
得票数 2
回答已采纳
1
回答
IE 8的问题
我的
网站
在mozila上工作正常,但当我们转到IE 8时,它在状态栏上显示错误User Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows
浏览 0
提问于2011-04-04
得票数 0
1
回答
在SharePoint online库中查找最近添加的文件
、
我的要求是使用图形apis在我的整个SharePoint Online (SPO)中搜索文件。我在MS Graph Explorer中使用的查询如下所示:基本上,上面的查询是搜索标题/名称为'res1a2b3c4d5e‘的所有文档。如果我搜索任何现有的文档,这将很好地工作。如果我试图搜索在进行上述调用之前创建/上传的任何文档,我将不会得到结果。 如果我在几分钟后搜索相同的内容,则请求成功。当我在我的客户站点上尝试相同的内容时,它有数百
浏览 2
提问于2017-04-18
得票数 1
1
回答
雅虎管道合法性
、
、
如果一个
网站
声明不抓取他们的
网站
,那么使用Yahoo Pipes或YQL这样的工具来创建mash up还合法吗?谢谢。
浏览 2
提问于2013-09-26
得票数 0
3
回答
网站
质量保证测试
、
、
它主要是爬行一个
网站
,并显示对死链接、页面等的引用:。 我发现这对我们发布的
网站
的质量保证非常有用。我想知道是否有人使用应用程序来
爬
取
这样的站点,但也会检查诸如缺少ALT标记、可访问性问题和有效的xHtml代码。
浏览 1
提问于2009-08-28
得票数 0
1
回答
如何用python
爬
取
数据并保存到excel?
利用python
爬
取
豆瓣电影排行榜(https://movie.douban.com/chart)的数据并保存到excel中。用相同代码
爬
取
网页豆瓣top250的数据可以
爬
取到excel中,但将网址及相关信息改为网页豆瓣电影排行榜中的信息时便无法
爬
取
,也找不出问题所在。以下图片为完整代码。
浏览 335
提问于2021-01-09
2
回答
我如何“获得”数据的所有酒吧/俱乐部在美国的数据库。Yelp API?
、
、
、
、
我要做的是创建一个美国所有酒吧的数据库。我需要这个数据库半定期更新(大约每周),以包括新开的酒吧。
浏览 0
提问于2011-01-18
得票数 1
1
回答
转换浏览器cookies并在cURL
爬
网中使用
、
、
首先,这样做的目的是
爬
取
我们的一个登录应用程序,并获取有关作业运行的数据,而我可能无法通过任何其他方式获取这些数据。我可以通过浏览器登录,也可以检查我的cookie;那么我如何(及时地)将这些信息添加到cURL调用中,以便我可以使用
PHP
来解析返回页面(和链接)?
浏览 3
提问于2015-11-18
得票数 0
1
回答
从Google索引中删除整个
网站
、
*Googlebot/2.1.*$这是当Googlebot尝试
爬
取
内容时返回给它的内容 HTTP/1.1 410过期日期: Sat,05 Jan 2013 120.9.8e-fips-rhel5 mod_fastcgi/2.4.6 mod_jk/1.2.37 mod_auth_passthrough/2.1 mod_bwlimited/1.4 FrontPage/5.0.2.2635
PHP
我的
网站
也从谷歌搜索
浏览 4
提问于2011-05-17
得票数 1
2
回答
通过
爬
取
网站
来构建
网站
的结构
、
当我重构一个
网站
时,我喜欢弄清楚现有的结构,以确保在将其移植到新的导航/菜单系统时不会遗漏任何东西。有没有自动化的工具可以在一个页面上生成
网站
的视觉结构?
浏览 0
提问于2015-02-04
得票数 0
2
回答
TYPO3: indexed_search -索引所有页面而无需首先访问
、
通常,indexed_search只对已经访问过的页面进行索引。如果用户没有访问过该页面,则不会有搜索结果。有没有一种不需要访问就能索引所有页面的方法?或者我必须使用另一个扩展?
浏览 0
提问于2012-01-16
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Java使用WebMagic 爬取网站
爬取美团网站信息(三)
多线程爬取小说网站
爬取美团网站信息(一)
爬取美团网站信息(二)
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券