腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
有没有任何快速
的
方法来刮一个有
无限
滚动
的
网站?
、
我正在尝试
使用
python来抓取一个用
无限
滚动
实现
的
网站。实际上,网络就是pinterest。我知道
如何
使用
selenium
来抓取具有
无限
滚动
的
web。但是,WebDriver基本上模仿了访问web
的
过程,而且速度慢得多,比
使用
BeautifulSoup
和
urllib进行抓取要慢很多。你知道有什么时间有效
的
方法来刮一个
无
浏览 0
提问于2014-12-29
得票数 0
回答已采纳
1
回答
如何
使用
BeautifulSoup
和
Selenium
从
无限
滚动
的
网页
中
获取
数据
、
、
、
、
问题是我
的
代码无法
获取
链接下
的
所有文章,因为它是可
滚动
的
。我找到了一个名为
selenium
的
包,但是仍然
使用
selenium
,我
的
代码找不到所有的文章。import osfrom lxml import htmlfrom urllib.request importurlopen from
sele
浏览 24
提问于2020-09-15
得票数 1
2
回答
如何
抓取youtube视频,以获得比一页更多
的
视频?
、
、
我想刮youtube收集关于视频
的
描述基于我
的
搜索查询。我正在
使用
BeautifulSoup
4来做到这一点。我已经成功地找到了视频网址。我面临
的
问题是,我想收集至少2000每个类别的视频链接。
如何
收集更多视频
的
网址?from bs4 import
BeautifulSoup
as bsBASE_SEARC
浏览 1
提问于2019-04-25
得票数 1
回答已采纳
1
回答
当我
使用
BeautifulSoup
进行抓取时,这些不同
的
错误是什么?
、
、
、
我正在尝试刮这个名为
的
站点,下面是我用来抓取其中一个特定页面的简单代码。import requestsfrom bs4 import
BeautifulSoup
pageSoup =
BeautifulSoup
浏览 0
提问于2019-04-06
得票数 0
回答已采纳
3
回答
在没有Twitter API
的
情况下根据Hashtag抓取历史推文
、
、
、
、
我有一个网络爬行器,给出一个标签,将返回带有该标签
的
推文。我遇到
的
问题是,当我向twitter请求
获取
标签时,我只收到了大约20条tweet。我
使用
请求来发出请求并抓取页面源代码,其中只包含20条tweet。我相信twitter一次只渲染几个tweet,但我想知道是否有一种方法,可以在不
使用
twitter api
的
情况下,获得比最初在页面上呈现
的
更多
的
tweet。我当前发出请求
的
代码如下所示:from
浏览 0
提问于2017-06-13
得票数 0
1
回答
我试着用硒
和
漂亮
的
汤刮网站。
、
、
我
如何
才能得到在同一网站
的
每个列表页面上提到
的
所有类别,即代码
和
标题,我正试图通过
selenium
刮取网站,并
使用
漂亮
的
汤来刮每一页。在这里,我试图
从
网站上抓取每一页,并将其作为df1附加到dataframe。CSS=51%&Type=desc&SS%27=%27") while True: soup =
BeautifulSoup
(x, &
浏览 2
提问于2019-08-23
得票数 1
回答已采纳
1
回答
Selenium
不会在
无限
滚动
网页
上
滚动
到末尾
因为
网页
是
无限
滚动
的
,所以我
使用
selenium
滚动
到最后。但是,它不会
滚动
到
使用
Selenium
的
第一页之外。有人能告诉我我哪里做错了吗?import timefrom
selenium
import webdriver from urllib.request import urlopendriver
浏览 0
提问于2021-02-03
得票数 0
1
回答
使用
Python
从
嵌入式google地图中抓取点信息
、
、
、
、
我正在尝试
使用
请求库+漂亮
的
汤,从这个网站上显示
的
地图上拉出关于天线点
的
信息。http://www.sites.bipt.be/ 我最初
的
计划是遍历站点编号,在单击点时拉出左侧面板上显示
的
经纬度信息,并在Arc
中
显示该
数据
。到目前为止,我已经访问了单击点时该信息所在
的
元素( id = selectedsite ... )。但是python
中
的
元素似乎是因为什么都没有点击
浏览 15
提问于2020-01-15
得票数 0
1
回答
如何
使用
类查找div之间
的
文本
、
import bs4from bs4 import
BeautifulSoup
as soup my_url=
如何
打印所有的游戏?
浏览 21
提问于2020-06-15
得票数 0
1
回答
滚动
到
网页
底部
、
、
、
、
我正在试着做一个小脚本,看看
网页
的
主页,并发现添加。附言
浏览 0
提问于2015-08-29
得票数 1
1
回答
从
windguru
中
抓取表
、
、
我尝试过从中抓取表格,但我无法
使用
BeautifulSoup
找到该表格。import requestsurl = "https://www.windguru.cz/archive.php?id_spot=49308&id_model=3&date_from=2012-01-01&date_to=2012-12-31" page = requests.g
浏览 2
提问于2019-10-31
得票数 0
1
回答
将元素
从
BeautifulSoup
发送到
Selenium
、
、
我正在
使用
Selenium
浏览
网页
。为了分析元素和
数据
,我
使用
了
BeautifulSoup
,因为它们提供了很好
的
选项,包括
使用
正则表达式进行搜索。所以现在我在
BeautifulSoup
中找到了一个元素。我想在
Selenium
中选择它。 我想我可以通过某种方式将XPath或CSS选择器
从
BeautifulSoup
元素传递到
Selenium
元素。有没有
从</e
浏览 4
提问于2015-09-28
得票数 3
2
回答
Scrapy:
从
squawka
获取
数据
、
、
、
、
我正试图
从
斯考卡
的
网页
:
中
抓取埃弗顿
和
阿斯顿维拉之间拍摄
的
照片
的
x
和
y坐标。/g22/circle). )每个镜头圆
的
像素坐标包含在cx
和
cy属性
中
。我曾尝试
使用
Python
中
的
scrapy模块刮取这些数字,但没有成功。我对此非常陌生,并基本上适应了刮除教程
中
的
代码。它说它没有爬行任何<em
浏览 5
提问于2014-10-26
得票数 0
回答已采纳
2
回答
在amazon lambda python
中
运行
selenium
webdriver
、
、
、
、
我想在amazon lambda
中
运行
BeautifulSoup
和
selenium
webdriver,我
的
运行环境是python3.6。可以运行吗?如果是这样的话是怎么做
的
。我
的
意图是
使用
漂亮
的
Soup4
和
selenium
从
网页
中
删除
数据
(因为它必须删除由javascript动态生成
的
数据
)
浏览 4
提问于2018-04-21
得票数 14
回答已采纳
1
回答
使用
selenium
webdriver
滚动
后
获取
更新
的
页面
、
、
、
、
我正在尝试
使用
selenium
webdriver
从
youtube搜索
中
抓取标题
和
链接,目前我正在迭代这个过程,直到某个条件变为false。虽然我可以看到页面在启动时正在
滚动
,但我得到
的
数据
似乎只来自第一个页面,然后才
滚动
一次。向下
滚动
后
如何
访问更新后
的
数据
?这是我
的
一些代码:while (condition)
浏览 0
提问于2020-07-25
得票数 0
1
回答
用
BeautifulSoup
实现Web抓取DOI
、
我目前正在做一个关于网络抓取
的
项目,我需要从谷歌学者
的
记录
中
获得信息。我需要提取文章
的
DOI,相应
的
HTML页面如下所示。="//doi.org/10.1007/s00508-019-1485-6">10.1007/s00508-019-1485-6</a> </span>page =
BeautifulSoup
(respons
浏览 4
提问于2021-11-19
得票数 0
6
回答
任何Python替代
Selenium
以编程方式登录到需要JavaScript登录
的
网站?
、
、
我正在写一个小
的
私人应用,每天自动登录我
的
网上银行,并下载最新
的
交易。我把它写成Django应用程序,所以我在Python
中
工作。我
的
网上银行似乎没有JavaScript就不能工作--我认为它
使用
JavaScript分配某种类型
的
会话ID。通过httplib
获取
登录页面给了我一个页面,告诉我JavaScript是必需
的
。因此,我现在正在寻找
获取
web页面的库,和在它们上执行JavaScript。几乎是无头浏览器。 我
浏览 3
提问于2010-01-24
得票数 19
回答已采纳
2
回答
python
BeautifulSoup
的
奇怪行为
我
使用
下面的代码
从
网站读取表格。在第一个例子
中
,一切都如预期
的
那样工作。对于第二个示例(注释变量),我只得到第一列。我找不到原因。有人能帮忙吗?import pprint URL = 'http://www.proplanta.de/Markt-und-Preis(URL,
浏览 1
提问于2016-03-17
得票数 1
回答已采纳
1
回答
我们可以下载一个完整
的
无限
滚动
的
网页
而不需要实际
的
滚动
吗?
、
、
、
、
我有一个
无限
滚动
的
网页
(只向下
滚动
)。我自动
滚动
,但过了一段时间,页面变得太大,无法进一步
滚动
。我
从
源代码
中
手动删除了读取
的
DIV块,它将
网页
大小减少到正常,但
滚动
速度仍然没有提高。我只能
滚动
1-2%
的
网页
。有没有办法让我在这个
网页
的
客户端
获取
完整
的
浏览 2
提问于2014-12-22
得票数 1
2
回答
BeautifulSoup
不会
从
网页
中提取所有表单
、
、
、
、
我希望从一个给定
的
网站
使用
Python3
和
BeautifulSoup
提取所有表单。下面是一个执行此操作
的
示例,但无法提取所有表单:from bs4 import
BeautifulSoup
data = urlopen(url) parser =
Beautiful
浏览 0
提问于2017-03-27
得票数 2
点击加载更多
相关
资讯
python如何使用Selenium获取弹出框架中的内容
如何使用DNS和SQLi从数据库中获取数据样本
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
2024,Python爬虫系统入门与多领域实战(完结)
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券