腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
调整
其他
网站
的
Web
抓取
代码
、
、
、
我目前正在使用这段
代码
来从TrustPilot
网站
上获取评论。我希望
调整
代码
以从()中
抓取
评论。然而,与大多数
其他
评论
网站
不同
的
是,评论并没有被分成多个子页面,而是在页面的末尾有一个按钮来“查看更多评论”,每当你按下它时,它就会显示3条额外
的
评论。有没有可能
调整
代码
,使其能够在具有这种
web
结构
的
网站
内从该特定产品中
抓取
所有评论
浏览 15
提问于2020-03-07
得票数 0
回答已采纳
3
回答
抓取
网站
的
请求/第二标准是什么?
这是与我
的
问题最接近
的
问题,但它并没有得到很好
的
回答: 你每秒应该做多少个请求来
抓取
?对此有什么标准吗?当然,所有的大型搜索引擎在这方面都有一些他们所遵循
的
准则。
浏览 0
提问于2010-05-30
得票数 10
5
回答
如何从
其他
网站
获取数据?
、
、
、
我想创建一个
网站
,从
其他
网站
提取信息,并将它们打印到我
的
网站
上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?
浏览 1
提问于2013-06-14
得票数 4
1
回答
Web
抓取
动态页面-
调整
代码
、
、
、
、
帮助我构建了这个
代码
,用于从这个动态加载评论
的
页面中
抓取
评论。然后我试着
调整
它,使其不仅
抓取
评论正文,还
抓取
评论者
的
姓名、日期和评分,并让
代码
将提取
的
数据保存到excel文件中。但我没有做到这一点。有没有人能帮我正确
调整
代码
?这是来自
的
代码
from bs4 import BeautifulSoup de
浏览 20
提问于2020-03-09
得票数 0
回答已采纳
1
回答
使用python beatifulsoup解析整个
网站
、
、
、
当我为了学习
的
目的而试图解析时。当我运行
代码
时,它只解析一个页面,我
的
意思是,主页。from bs4 import BeautifulSoupfrom urllib.request import urlopen import pandas as pd df = pd.Data
浏览 1
提问于2018-11-08
得票数 1
2
回答
是否需要为每个目标站点编写
抓取
器?
、
、
、
、
我是个刮东西
的
新手。我写了一个 刮板 它将擦伤 Maplin 商店。我使用Python语言和BeautifulSoup来
抓取
存储。我想问
的
是,如果我需要清理一些
其他
的
eCommerce商店(比如亚马逊、Flipkart),我是否需要定制我
的
代码
,因为它们具有不同
的
HTML ( 和 名字是不同
的
,另外还有
其他
东西)。所以,我写
的
刮板不适用于
其他
eCommerce商店。 我想知道比价<
浏览 40
提问于2014-12-28
得票数 7
回答已采纳
2
回答
从iPhone应用程序中
抓取
网页
的
最好方法是什么?
、
、
我正在写一个iphone应用程序,我需要在50+
网站
上搜索数据。有什么建议吗? 谢谢罗翰
浏览 0
提问于2012-06-07
得票数 1
回答已采纳
1
回答
下面的JavaScript
代码
与Facebook相关
这看起来像一个异步函数,它是这个异步函数是做什么
的
?为什么它被称为“刮板”?
浏览 0
提问于2012-09-08
得票数 0
回答已采纳
2
回答
如何隐藏页面源
代码
中
的
实际内容
、
、
、
我试图做隐藏在页面源
代码
的
实际内容。例如,如果用户通过浏览器访问第一个或第二个etc页面,用户可以看到不同
的
信息,但当用户访问第二个页面并单击鼠标右键转到页面来源时,用户只能看到第一个页面信息。我有很多这样做
的
网站
。我想知道怎么做。我想避免人们刮我
的
网站
。我希望在响应中避免实际
的
数据或信息。我
的
问题是,有可能做到这一点吗?如果有可能怎么办?请告诉我我是新来
的
网域。
浏览 0
提问于2012-06-09
得票数 0
回答已采纳
1
回答
爬虫包:不爬行某些
网站
、
、
、
我用Rcrawler来
抓取
一个urls向量。对他们中
的
大多数人来说,这是很好
的
工作,但现在和他们中
的
每一个都不会被爬行。一开始,我只在https:// sites上注意到了这一点,它
的
地址是。但是我使用
的
是0.1.7版本,它应该具有https:// capability。 我还发现也有同样
的
问题,但也有http://链接。我查了一下我
的
情况,他
的
网站
也不适合
浏览 3
提问于2018-04-20
得票数 4
回答已采纳
1
回答
使用python从同一网页中
的
多个链接中提取数据
、
、
、
我是蟒蛇和网络
抓取
的
新手。测试索引有用于各种临床测试
的
测试组件
的
名称列表。单击每个名称将带您到另一个页面,其中包含有关单个测试组件
的
详细信息。我想从这一页中提取出有共同问题
的
部分。 最后,将包含测试组件名称
的
数据框架放在一列中,将常见问题中
的
每个问题作为
浏览 1
提问于2018-01-19
得票数 0
1
回答
找不到项目文件"http://localhost/xxx“”时出现MsBuild错误MSB3202
、
在我们
的
解决方案中,我们有几个
网站
,而不是
web
应用程序项目,以及一堆C#项目。这些
网站
引用了
其他
C#项目。在Visual Studio中构建isproj时,一切都很好。但是,当在命令行构建解决方案时,在同一台开发机器上,使用独立构建,isproj将在两个
网站
上抛出以下错误: C:\Program Files (x86)\MSBuild\InstallShield\2012Spring
浏览 6
提问于2012-10-25
得票数 0
1
回答
与完整
的
网站
相比,我
抓取
的
HTML
代码
似乎并不完整。HTML会动态变化吗?
、
我目前正在
抓取
一个
网站
,以便能够在本地对数据进行排序,然而,当我这样做时,
代码
似乎不完整,我觉得在我滚动
网站
以添加更多内容时,可能会发生变化。这会发生吗?如果是这样的话,我如何确保我能够
抓取
整个
网站
进行处理呢? 我目前只知道一些python和html用于
web
抓取
,正在寻找
其他
可能影响这个问题
的
元素(javascript或ReactJS等)。我希望在
抓取
网站
时得到50个名字
浏览 0
提问于2019-01-02
得票数 0
2
回答
在javascript中提出一个简单
的
get请求
、
我试图在javascript中做一些简单
的
get
抓取
,从美味或美味
的
站点获取html
代码
来存储菜谱。一个例子是这个站点:,但是,当我使用fetch时,我无法使它工作。实际上,我用python编写了等效
的
代码
,希望能够将这些
代码
转换为javascript。,我能够让javascript
代码
工作。/users/maecapozzi') .then(res => console.log('response:
浏览 1
提问于2019-05-31
得票数 0
回答已采纳
1
回答
删除网页时,SEO
的
最佳实践是什么?我应该使用什么返回
代码
?
、
在一个实时
网站
上,假设有一个页面已经过时了,旧
的
信息。 就把它删除可以吗?或者,我是否必须设置Apache重定向,或者为
web
爬虫做404或
其他
特殊
的
操作?
浏览 0
提问于2013-08-21
得票数 0
回答已采纳
1
回答
使用python进行
Web
抓取
并在
网站
上生成价格
、
、
、
所以基本上我正在做一个涉及网络
抓取
的
学校项目。我知道如何使用python和整合
web
抓取
,但是如何将
抓取
的
数据放到
网站
上呢?如果它有帮助,我正在制作一个
网站
,从
其他
网站
拉动价格,并在我
的
展示它。(像Trivago)我在网上找不到太多,所以任何帮助都是很好
的
。
浏览 11
提问于2018-01-31
得票数 1
回答已采纳
2
回答
Twitter API vs
Web
抓取
?
、
、
、
、
首先,我想获得我twitter账户
的
所有追随者。我做了一点研究,发现我们可以用Ruby on rails做
web
抓取
,使用: Nokogiri或Mechanize gem。我还得到了一个css选择器,用于
web
抓取
。现在,如果我查找HTML页面源
代码
,它不会显示该帐户
的
所有追随者。我真的可以使用
web
抓取
代码
来获取我所有的twitter追随者,还是应该使用Twitter API?
浏览 2
提问于2012-11-08
得票数 0
回答已采纳
1
回答
在asp.net中,如何在对结果进行分页时,对多条记录进行筛选?
、
HTML Agility Pack在这个问题上会有帮助吗,或者
其他
任何工具对这个问题或任何
其他
方式都有帮助?
浏览 3
提问于2009-12-09
得票数 0
2
回答
怎样才能在一定时间内找到
网站
的
请求限制?
、
、
、
我已经找过了,但我没有找到解决问题
的
办法。这些天来,我在用BeautifulSoup进行
web
抓取
。所以我在使用它
的
时候遇到了一个问题。为了快速运行,我尝试运行我
的
代码
不止一个,但当运行与3个以上
的
程序,同一时间,网页阻止了我一段时间(我分别运行不同
的
脚本)。正因为如此,有什么技术可以找出
网站
对同一个IP或用户
的
请求限制吗?如果与此无关,我如何才能找到实现
网站
的
最佳请求限制?提前谢
浏览 11
提问于2022-08-16
得票数 0
1
回答
php dom xpath从站点中
的
所有文件夹中提取所有链接
、
、
我还没有找到我要找
的
东西。也许它叫别的什么..我有下面的
代码
,它将
抓取
第一个文件夹中
的
所有内容,但不会从
其他
文件夹中
抓取
其他
项目。例如,它会
抓取
第一个/前面的所有内容,但如果你有一个站点mysite.com/ folder2 /,它就不会
抓取
folder2。一切都是联系在一起
的
。它也会向后移动。如果你把最长
的
链接放在
网站
的
前面就会一直
浏览 0
提问于2013-02-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
不用编程,几步做简单的数据抓取,web
网站抓取引子-获得网页中的表格
非常好用的开源爬虫AI工具!无需编程也能轻松抓取网站数据!(内附同类其他工具对比)
网站收录骤停?是抓取异常导致的!
网站抓取异常的原因及解决方法
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券