使用BeautifulSoup抓取href

、、

我正在尝试从以下url中抓取每个资源的页面趋势表数据:pcaiso.com/todaysoutlook/ CO2 /emessions.html 的href属性包含图表的数据集(作为一个非常长的字符串url = 'http://www.caiso.com/todaysoutlook/pages/emissions.html' soup = BeautifulSoup

浏览 20提问于2021-04-14得票数 0

1回答

Web抓取:阅读所有的href

、、

我用python编写了一个小脚本来读取网页中的所有href。但它有个问题。例如，它不读href="pages.php?代码：import re regex='href=\"(.+?)

浏览 2提问于2017-05-11得票数 1

回答已采纳

1回答

如何使python代码请求URL并根据需要从网页中刮取信息

、、

我正在使用一个简单的python代码来尝试获取一个URL，并在这个URL的主页/根页面下刮出每个网页中提到的所有其他URL(如果有的话，所有html子页面)。我的问题是，我是否正确地使用了socks？我的脚本也会处理根网址下的所有网页吗？因为我想刮所有的urls从所有这样的网页下的根网址。

浏览 1提问于2017-12-19得票数 0

回答已采纳

2回答

(Python)尝试从网站中隔离一些数据

、

to download #The idea is to go to http://wallbase.cc/x and to take all of strings containing <a href

浏览 0提问于2014-02-03得票数 0

3回答

如何从YouTube搜索中抓取视频？

、

我想搜索一个特定的关键字，然后抓取所有的视频网址。for link in links:如何抓取链接并将其保存到文件中？

浏览 0提问于2017-07-28得票数 3

1回答

如何使用beautifulSoup对堆栈溢出问题进行web抓取标记？

、

for link in soup.find_all('a', {'class': 'post-tag'}): # href = link.get('href') for在从堆栈溢出站点提取数据时，我们在抓取问题的标签时遇到了问题。我们可以抓取标签，但它们不会显示在问题中。

浏览 0提问于2018-03-17得票数 0

1回答

处理给BeautifulSoup的坏链接的最好方法是什么？

、、

我正在做一些工作，从美味中提取urls，然后使用这些urls来发现相关的提要。 soup = BeautifulSoup(html) File "/Library/Python/2.5/site-packages/BeautifulSoup.py", line 1499, in __init__

浏览 0提问于2009-01-17得票数 1

回答已采纳

3回答

Python获取网页数据

我正在尝试创建一个从tv catchup网站获取html的节目，然后使用split函数将所有html数据拆分成频道名称和表中当前正在播放的节目，例如: BBC 1- 'program name‘。urlopen('http://www.TVcatchup.com') firstSplit = html.split('<a class="enabled" href

浏览 10提问于2012-12-20得票数 1

1回答

使用BeautifulSoup在Python中抓取href链接

、、、

我试图从这个网站：中抓取存储在href值中的链接。r = requests.get(url)soup = BeautifulSoup(html_doc, 'html.parser') [tag['href'] for tag in soup.find_all('a',{'class':'css-11smhdq-FtContainer e1ym2d3s2&

浏览 11提问于2022-10-28得票数 1

回答已采纳

1回答

如何访问谷歌搜索结果的第一个结果(突出一个视频链接)？

、、、

编辑:我的输入将是我在谷歌搜索框中查询的字符串。就像这个“黑色安息日铁人”

浏览 1提问于2014-12-11得票数 0

回答已采纳

2回答

无法使用selenium python从网站抓取多个URL

、、、

我正在尝试从here抓取文章的日期和网址。虽然我确实得到了日期列表和文章的标题(文本)，但我无法获得相同的Urls。这就是我如何在文本和日期中获得url标题。为了获得所有人的链接，我尝试如下所示 n_links = [ele.get_attribute('href') for ele in news_links.find_elements_by_tag_name

浏览 38提问于2021-08-09得票数 0

回答已采纳

1回答

使用python从文本文件中检索特定html标记之间的文本。

、

例如, "<span class="proflinkWrapper"><span class="proflinkPrefix">+</span><a class="proflink" href="https

浏览 1提问于2019-01-19得票数 1

1回答

如何使用python在网页的HTML中搜索包含特定单词的URL？

、、

使用Python，我希望能够创建我从多个页面获取的URL列表，每个页面都有一个链接(尽管页面上可能有多个对同一链接的引用)，其中每个URL中都有重复的关键字。

浏览 38提问于2020-04-10得票数 1

回答已采纳

2回答

我正在抓取一个网页，其中有一个没有页面，我如何才能抓取这些页面，以获得我想要的信息。假设我正在抓取一个URL ，这个页面有两个页面，我如何抓取这些总页面并得到总的产品列表。到目前为止我所做的是:我从他们那里抓取一个url，我通过正则表达式抓取一个特定的url，并试图从那个url中找到他们的链接，其他页面中没有包含链接产品名称的信息。我想要从所有页面中获取产品名称。("a", href=re.compile(r"ExpProduct\.asp

浏览 1提问于2016-02-28得票数 0

1回答

Python :如果满足特定条件，如何使用不同的抓取页面重复“bs4”循环？

、、

我正在尝试创建一个for循环，一旦它到达抓取的页面中的最后一个search_result属性，它将重复该循环，但会使用新抓取的网页的数据。在for循环到达最后一个属性后，它将在网页上查找链接，并对新抓取的网页重复该循环。from bs4 import BeautifulSoup soup = <em

浏览 7提问于2019-08-16得票数 1

回答已采纳

1回答

如何有选择地从div标签中抓取href？

、、

我正在试着从一个新闻网站上抓取URLS。具体地说，它们是针对特定搜索词的搜索结果中列出的新闻文章的URL。我刚接触BeautifulSoup，我不知道如何有选择地抓取链接到一篇文章的href(当我试图抓取div标签中的子href时，我只得到一个空集，而当我抓取一个标记时，我得到的URL远远多于我想要的。q=aramco 这是我正在使用的代码。import requests, random, re from bs4 import Beautifu

浏览 24提问于2020-03-21得票数 0

回答已采纳

1回答

用Beautifulsoup抓取视频描述

、、、

我试着在youtube上抓取视频描述中的链接，但列表总是返回空。我已经尝试从我抓取的位置更改标记，但输出和错误消息都没有更改。下面是我使用的代码： from bs4 import BeautifulSoup soup = BeautifulSoup(source, 'lxml'

浏览 12提问于2021-09-08得票数 0

回答已采纳

1回答

BeautifulSoup抓取多个链接

、、

我想使用BeautifulSoup抓取这个website，首先提取每个链接，然后一个接一个地打开它们。一旦他们被打开，我想刮公司的名称，它的股票代码，股票交易和提取多个PDF链接时，他们是可用的。' data.append(str(link.get('href'))) print(link)(req.content, 'html.parser&

浏览 18提问于2021-04-11得票数 0

回答已采纳

2回答

为什么这个递归停止了？

from urllib import urlopen try: return 0 str = tag[&#

浏览 0提问于2012-07-28得票数 0

回答已采纳

3回答

Webscraping -写入CSV时重复

、、

我正在尝试抓取这个网站上所有帖子的urls：from bs4 import BeautifulSoupf = csv.writernewline=''))def parseLinks

浏览 0提问于2018-04-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Web抓取:阅读所有的href

如何使python代码请求URL并根据需要从网页中刮取信息

(Python)尝试从网站中隔离一些数据

如何从YouTube搜索中抓取视频？

如何使用beautifulSoup对堆栈溢出问题进行web抓取标记？

处理给BeautifulSoup的坏链接的最好方法是什么？

Python获取网页数据

使用BeautifulSoup在Python中抓取href链接

如何访问谷歌搜索结果的第一个结果(突出一个视频链接)？

无法使用selenium python从网站抓取多个URL

使用python从文本文件中检索特定html标记之间的文本。

如何使用python在网页的HTML中搜索包含特定单词的URL？

如何抓取没有页数的url

Python :如果满足特定条件，如何使用不同的抓取页面重复“bs4”循环？

如何有选择地从div标签中抓取href？

用Beautifulsoup抓取视频描述

BeautifulSoup抓取多个链接

为什么这个递归停止了？

Webscraping -写入CSV时重复

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐