腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
关于
使用
BeautifulSoup
进行
网页
抓取
的
一些
错误
、
、
试图提取巴西足球锦标赛表格中
的
球队列表,搜索正确
的
标签和类别,但没有得到任何返回数据。我已经尝试阅读了BS4网站上
的
官方文档,但我仍然无法解决这个问题。如果有人能帮助我,我将不胜感激。下面是
使用
的
屏幕截图和代码。页面:https://i.stack.imgur.com/9YTJf.png 通过选择器
使用
元素检查器:https://i.stack.imgur.com/asMng.png 开发人员工具窗口:https:/&
浏览 13
提问于2020-09-19
得票数 2
回答已采纳
2
回答
使用
BeautifulSoup
进行
网页
抓取
、
、
、
我想从这个链接中删除国家名称和国家首都:from bs4 import
BeautifulSoup
soup =
BeautifulSoup
(html, "html.parser") co
浏览 1
提问于2015-11-20
得票数 0
1
回答
使用
Python、
BeautifulSoup
进行
网页
抓取
、
、
、
、
我在
使用
Python解析链接时遇到了问题。下面是我
的
代码: def get_content(html): items = soup.find_all('divlink = item.find('a', class_='gl-product-card__details-link') print(link.get('href')) 我得到了这个
错误
浏览 7
提问于2020-06-15
得票数 1
回答已采纳
1
回答
BS4返回到Cloudflare网站,而不是实际
的
网站
、
、
、
这是我
的
代码。这是有效
的
,但当代码打印时,它会打印DDOS攻击网站,而不是加载之后
的
网站。我甚至尝试做一个time.sleep(5)来帮助计时。 我怎么才能克服这一点。import requestsimport time url = 'https://www.psacard.com/cert/49628062User-Agent': 'Mozilla/5.0 (X11; Ubun
浏览 26
提问于2021-01-15
得票数 0
1
回答
Python :如果满足特定条件,如何
使用
不同
的
抓取
页面重复“bs4”循环?
、
、
我正在尝试创建一个for循环,一旦它到达
抓取
的
页面中
的
最后一个search_result属性,它将重复该循环,但会
使用
新
抓取
的
网页
的
数据。在for循环到达最后一个属性后,它将在
网页
上查找链接,并对新
抓取
的
网页
重复该循环。 我已经写了下面的代码,但循环不会重复从原始
网页
的
链接中获得新
的
抓取
页面。import re
浏览 7
提问于2019-08-16
得票数 1
回答已采纳
1
回答
BeautifulSoup
4返回
错误
的
超文本标记语言?
、
、
我正在尝试
使用
Beautifulsoup
在Indeed.com上通过网络
抓取
招聘信息。但是,当我
抓取
URL时,返回
的
HTML与我在Google Chrome中手动转到URL,然后查看HTML时看到
的
HTML不同。 这会导致我
的
应用程序获得
一些
不在我试图
抓取
的
网页
上
的
招聘信息。,没有来自谷歌、Amuseio等公司
的
招聘信息,而且实际
网页
上
的
浏览 0
提问于2019-07-10
得票数 2
1
回答
使用
BeautifulSoup
进行
网页
抓取
时出现429
错误
、
、
、
首先,我不得不说,我对
使用
Python
进行
Web
抓取
非常陌生。我正在尝试
使用
这些代码行来收集数据from bs4 import
BeautifulSoup
html_page = requests.get(baseurl).text soup =
BeautifulSoup
(html_page, 'html.parser
浏览 3
提问于2018-08-02
得票数 1
回答已采纳
1
回答
抓取
aspx页面的Python代码是什么?
、
、
、
、
我
的
要求是将mcode传递给下面的web aspx查询,然后将结果
网页
打印到pdf。在上面的url中,唯一
的
变量是99999。因此,我
的
目标是每次传递mcode,然后将生成
的
aspx页面打印为pdf。请原谅我
的
简体语言,因为我对此还不熟悉。
浏览 2
提问于2020-03-18
得票数 0
1
回答
Python从搜索结果中
抓取
链接
、
、
、
、
我正在尝试
使用
Python从新闻网站
的
关键字搜索中生成/检索新闻链接列表。对于谷歌搜索,我知道有些
使用
,但谷歌搜索页面有自己
的
链接地址(即),有些网站不通过网站地址传递关键字。首先--例如,在中,不管用户键入哪个关键字(是另一个例子),用户都会被引导到具有链接列表
的
搜索结果页面。这样,是否仍然可以
使用
Python库来提取这些链接?我应该
使用
哪些工具和技术来制作一个全面的新闻链接列表?
浏览 2
提问于2015-10-28
得票数 1
1
回答
如何配置Scrapy以
使用
BeautifulSoup
解析器
、
、
、
我
使用
BeautifulSoup
的
默认html.parser从任何
网页
中提取数据,没有什么原因让我觉得它比
使用
XPATH/CSS选择器更灵活、更强大。在
抓取
之前,我学习了
使用
BeautifulSoup
进行
网络
抓取
。我想不出一种让Scrapy
使用
bs4作为解析器
的
方法。有可能吗?
浏览 2
提问于2019-08-18
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
进行
网页
抓取
:读取表
、
我正在尝试从transfermarkt.com上
的
一个表中获取数据。我用下面的代码获得了前25个条目。但是,我需要获取以下页面中
的
其余条目。当我点击第二个页面时,url没有改变。我试图在for循环中增加范围,但它给出了一个
错误
。任何建议都将不胜感激。import numpy as npimport requests url = 'https://Chrome/70.0.3538.1
浏览 0
提问于2019-09-27
得票数 1
1
回答
Python:当
使用
请求包在HTTPS页面上执行get请求时,如何确保凭据中
的
标志被封装
、
、
、
、
所以我
使用
BeautifulSoup
和请求从https网站获取数据类似于:中
的
解决方案这里有什么我需要考虑
的
吗?
浏览 0
提问于2018-07-10
得票数 0
回答已采纳
2
回答
使用
beautifulSoup
和urllib
进行
网页
抓取
、
、
我
使用
的
是python 3.6,我可以
使用
BeautifulSou.来
抓取
文本。我正在用沃尔玛网站练习。我试图从沃尔玛
抓取
文本。这是我
的
代码。from bs4 import
BeautifulSoup
main_page=urlopen('http://www.walmart.com/ip/Sceptre-32-Class-HD-720P-LED-TV
浏览 0
提问于2017-08-30
得票数 0
1
回答
屏幕刮擦提示:交互式图形
、
、
、
、
最近,我学习了
一些
关于
如何将
BeautifulSoup
与Python结合
使用
的
教程,并学习了如何简单地从
网页
中刮取文本和urls。我现在试着从下面的链接中
抓取
数据, 在页面底部有一个交互式
的
图形生成器,我想从它中
抓取
所有的数据,而不必花费很多时间从所有可能生成
的
图形中缓慢地写下值。我尝试过
使用
我卑微
的
初学者技术,但在HTML中图形数据来自何处并不明显-此外,HTML似乎是动态<e
浏览 0
提问于2014-08-08
得票数 3
回答已采纳
1
回答
在python中从字符串中删除特殊字符
、
、
我正在
使用
美汤来
抓取
一些
html/xhtml
网页
,如下所示:soup =
BeautifulSoup
(response.text)但是,我
的
输出显示了几个我想要过滤掉
的
特殊字符(例如)。我想我遗漏了
一些
关于
解码
的
东西。 你能告诉我这里可能遗漏了什么吗?谢谢
浏览 3
提问于2017-07-07
得票数 1
回答已采纳
3
回答
使用
Python
进行
网页
抓取
:
BeautifulSoup
的
问题
请帮助我
使用
BeautifulSoup
来
使用
Python3从investing.com中
抓取
金融值。无论我做什么,都不会得到任何值,过滤类正在从
网页
永久更改,它是一个活生生
的
值。import requests url = "https://es.investing.com/indices/spain-35-futures= float(precio_obje
浏览 36
提问于2019-06-08
得票数 1
1
回答
试图从雅虎财经“世界指数”排行榜中剔除
、
、
我正在尝试
使用
下面的代码将雅虎财经(https://finance.yahoo.com/world-indices/)中
的
“世界指数”列表整理成一个数据框架。我试着寻找如何
进行
抓取
,但没有任何运气。 pandas datareader是未来
的
发展方向吗?有没有更强大
的
网络刮板我应该
使用
,如硒或美丽
的
汤?
浏览 18
提问于2021-09-22
得票数 0
3
回答
从许多不同网站上
抓取
数据
的
最好方法
、
、
我希望从许多不同
的
地方政府网站上获取公共数据。此数据不是以任何标准格式(XML、RSS等)提供
的
并且必须从HTML中
抓取
。我需要
抓取
这些数据,并将其存储在数据库中以备将来参考。理想情况下,
抓取
例程将在循环
的
基础上运行,并且只将新记录存储在数据库中。对于我来说,应该有一种方法可以在这些网站上轻松地检测到旧记录中
的
新记录。 我最大
的
问题是:实现这一目标的最佳方法是什么?我听说过
一些
YQL
的
用法。我还知道,
一些</
浏览 0
提问于2012-09-04
得票数 0
1
回答
从python中
的
表中
抓取
数据
、
、
我对python很陌生,在做了
一些
教程之后,
一些
关于
抓取
的
内容,我一直在自己尝试
一些
简单
的
抓取
。
使用
BeautifulSoup
,我设法从所有东西都有标签
的
网页
中获取数据,但没有它们,我
的
工作就很糟糕。 我试图从:http://www.bancochile.cl/cgi-bin/cgi_mone?pagina=变体人/
浏览 0
提问于2017-03-30
得票数 3
回答已采纳
1
回答
使用
BeautifulSoup
进行
网页
抓取
似乎访问了
错误
的
页面
、
、
、
我一直试图将网络
抓取
作为一个小项目。我正在尝试访问
网页
上
的
产品,并打印出它们已售出
的
次数。我
的
代码:import requests as req links = soup.find_all() print(link.get(
浏览 5
提问于2019-08-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python进行网页抓取的介绍
如何有效地使用网页操作器进行数据抓取?
成都欣荣启扬:关于使用tiktok需要避免的一些小错误!
关于Windows页面错误的一些基础概念
使用多个Python库开发网页爬虫(一)
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券