腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
Beautiful
Soup
抓取
网站
时
无法
加载
某些
内容
、
、
我试图从“纽约时报”的菜谱中剔除收视率,但在获取我需要的
内容
时
遇到了问题。当我查看《纽约时报》页面上的源代码
时
,我看到了以下
内容
: <div class="ratings-rating"> <span class="ratings-header ratings-content然而,当我通过
Beautiful
Soup
拉入页面源代码
时
,我只看到了以下
内容
: <div class="
浏览 30
提问于2019-03-05
得票数 1
回答已采纳
2
回答
有没有办法
使用
Selenium of
Beautiful
Soup
得到2015-2020年间每年1月份的“这个家”的Z值?
、
、
、
、
从下面的链接中,我希望能够
抓取
数据。然而,当我
使用
Beautiful
Soup
时
,我在html中找不到它,并且
Beautiful
soup
不起作用。此外,我想也许我可以
使用
selenium来
抓取
这些数据,但我也找不到这些
内容
。你知道我会如何
使用
selenium或
Beautiful
Soup
来获得2015-2020年间每年1月的“这个家”的Z估计值吗?提前感谢您的帮
浏览 0
提问于2020-08-17
得票数 1
2
回答
如何将
抓取
的数据发送到页面,而不等待页面
加载
?
、
、
、
我在我的Django
网站
上展示了一些
抓取
的数据..数据每小时会更改几次,因此需要更新。我
使用
Beautiful
Soup
抓取
数据,然后将其发送到视图,并将其传递到上下文字典中,以将其呈现在
网站
上。问题是,
抓取
功能需要一些时间才能工作,因此,在该功能完成工作之前,
网站
不会
加载
。我怎样才能让它
加载
得更快?数据
网站
上没有API。
浏览 16
提问于2021-01-28
得票数 0
3
回答
如何在
网站
使用
javascript
时
查找源代码
、
我想要实现的目标
网站
已经尝试过的
内容
。我试着
使用
Selenium驱动,但得到了不同的错误,这可能需要更多的时间,而且
使用</e
浏览 0
提问于2018-10-31
得票数 0
2
回答
抓取
动态超文本标记语言(YouTube注释)
、
、
、
、
有了
Beautiful
Soup
和Request Library,我可以
抓取
超文本标记语言的
内容
,但不能
抓取
JavaScript或AJAX调用的
内容
。import requests from bs4 import BeautifulSoup a
浏览 1
提问于2017-11-01
得票数 3
3
回答
美丽的汤在
使用
get_text ()后不能
使用
、
我正在做网络
抓取
,我只想从任何
网站
的文本,所以我
使用
的
Beautiful
Soup
。最初,我发现get_text()方法也返回了JavaScript代码,因此为了避免遇到应该
使用
extract()方法的问题,现在我遇到了一个奇怪的问题,在提取script和style标记之后,
Beautiful
Soup
甚至在新的` `html中都
无法
识别它的主体。,但当我这样做
时
soup
= BeautifulSo
浏览 20
提问于2015-07-05
得票数 3
回答已采纳
1
回答
忽略重定向的Python检索文件
、
、
我正在开发一个程序,它
使用
Beautiful
Soup
来
抓取
网站
,然后
使用
urllib来检索在
网站
上找到的图像(
使用
图像的直接URL)。我正在
抓取
的
网站
不是图像的原始主机,但确实链接到原始图像。我遇到的问题是,对于
某些
网站
,检索www.example.com/images/foobar.jpg会将我重定向到主页www.example.com,并生成一个空的(0K
浏览 0
提问于2014-03-15
得票数 0
2
回答
美汤和硒不能刮
网站
内容
、
、
所以我试着
抓取
网页的
内容
。最初我尝试
使用
BeautifulSoup,但是我
无法
获取
内容
,因为
内容
是动态
加载
的。在四处阅读之后,我试着根据人们的建议
使用
Selenium,但是在这样做之后,我仍然
无法
获取
内容
。刮出来的东西跟美汤一样。 是不是就不能
抓取
这个网页的
内容
呢?'/' + string_date[8:] url = "https:
浏览 35
提问于2021-08-11
得票数 0
回答已采纳
1
回答
可以在web应用程序中
使用
Selenium吗?
我正在建立一个在Django的
网站
,将从一些
网站
抓取
数据,这样人们就可以进入该
网站
,设置自定义数据过滤器,并查看
抓取
的数据在友好的格式。问题是requests和
beautiful
soup
模块不足以满足
抓取
目的,因为我还需要一些自动化操作(
加载
javascript或单击按钮)。由于Selenium要求下载webdriver并将其放入路径中,是否可以在web应用程序中
使用
它?比如在某个地方托管webdriver? 我也
浏览 3
提问于2018-07-01
得票数 1
3
回答
用于web
抓取
的Selenium与BeautifulSoup
、
、
、
我正在
使用
Python从一个
网站
上
抓取
内容
。首先,我在Python上
使用
了BeautifulSoup和Mechanize,但我看到
网站
上有一个通过JavaScript创建
内容
的按钮,所以我决定
使用
Selenium。既然我可以通过像driver.find_element_by_xpath这样的方法
使用
Selenium查找元素并获取它们的
内容
,那么当我可以
使用
Selenium做任何事情
时</em
浏览 1
提问于2013-07-03
得票数 53
回答已采纳
2
回答
美丽的汤Youtube订阅者
、
、
我
使用
Python with Requests和
Beautiful
Soup
来尝试
使用
以下代码返回
某些
Youtube频道的订阅者数量:from bs4 import BeautifulSouprequests.get("https://www.youtube.com/channel/UCFIjVWFZ__KhtTXHDJ7vgng")
soup
浏览 0
提问于2018-03-14
得票数 2
1
回答
未在美汤中找到<span>标记内的元素
、
、
、
我曾经尝试过在Python中
使用
Beautiful
Soup
从
网站
抓取
数据。当我检查
网站
本身
时
,我看到了以下
内容
:但是当我用美汤的时候,我看到的是:就好像出于安全和保护的目的
浏览 1
提问于2015-11-07
得票数 2
1
回答
XBMC中包含哪个美汤版本?
、
、
我正在尝试用Python结合XBMC来做一些
网站
抓取
。当我查看
Beautiful
Soup
的
网站
时
,它的最新版本是版本4。当我查看XBMC
时
,它显示为版本3.2.0 ()。现在有没有人知道XBMC中
使用
的是哪个版本?
浏览 0
提问于2013-09-25
得票数 0
1
回答
基于动态
内容
和隐藏数据表的Selenium Web
抓取
、
、
、
、
我正在
使用
Selenium和
Beautiful
Soup
在Python中对动态
内容
进行web
抓取
。问题是,即使
使用
以下代码,也
无法
将定价数据表解析为Python:sel_
soup
=BeautifulSoup(html, 'html.parser') 然而,我后来发现,如果我在
使
浏览 15
提问于2018-02-14
得票数 2
2
回答
漂亮汤还错了href值
、
、
、
我
使用
下面的代码为SERP做一些SEO,但是当我尝试读取href属性
时
,我得到了显示页面中其他有线URL的不正确结果,但没有显示预期的结果。我的密码怎么了?q=
beautiful
+
soup
&rlz=1C1GCEB_enIN922IN922&oq=
beautiful
+
soup
&aqs=chrome..69i57j69i60l3.2455j0j7&sourceid=chrome&ie=UTF-8"
浏览 5
提问于2021-11-16
得票数 0
回答已采纳
1
回答
如何解决漂亮汤在获取html
内容
时
出现“不可接受”的错误?
、
、
在尝试从
网站
获取数据
时
,我
无法
使用
Beautiful
soup
获取
网站
的html
内容
。我正在
使用
一个基本的get函数和请求来获取html,但输出为空。url= 'https://www.turbobearings.com/application.php'
soup
_=
soup
(html.conte
浏览 32
提问于2020-10-20
得票数 0
回答已采纳
1
回答
尝试解析div类,但
无法
获得正确的结果
、
BeautifulSoup text = urllib.request.urlopen(url).read()for div in data:我
使用
的是Py
浏览 0
提问于2018-08-07
得票数 2
1
回答
Python Web
抓取
:通过
加载
页面
抓取
页面
、
、
我正在建立一个网络
抓取
项目
使用
python与美丽的汤和请求模块,问题是我想要
抓取
的
网站
有一个
加载
页面(完全不同于主页),然后它将我重定向到主页。我怎么能等到页面
加载
完成,然后从主页上
抓取
数据呢?我知道Selenium可以处理这些类型的
网站
,但
网站
必须
使用
web驱动程序启动,这是我不希望在我的项目中
使用
的原因,这就是为什么我
使用
Beautiful
Soup<
浏览 15
提问于2020-10-25
得票数 0
1
回答
使用
Python进行Web
抓取
,而无需
加载
整个页面
、
、
、
我刚用Python开始了几个web
抓取
项目。我目前
使用
lxml,
Beautiful
Soup
和requests模块来
抓取
网页。我需要知道是否有任何方法可以只从
网站
获得我们需要的数据,而不是
加载
整个页面。requests模块执行GET请求并接收整个,bs4,lxml只过滤数据。
浏览 28
提问于2021-11-13
得票数 0
回答已采纳
2
回答
美丽的汤不等待页面完全
加载
、
、
、
因此,
使用
下面的代码,我想打开一个公寓
网站
URL并
抓取
该网页。唯一的问题是,
Beautiful
Soup
不会等到整个网页都呈现出来。在页面
加载
之前,公寓不会在html中呈现,这需要几秒钟的时间。from urllib.request import urlopen as uReq my_url = 'https://xxxxx.comsort=latest'
浏览 11
提问于2019-11-09
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python基础教程 Beautiful Soup
python爬虫
Python网络爬虫(五)-Requests和Beautiful Soup
推荐:手把手教你用Python进行Web抓取
手把手教你用Python进行Web抓取
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券