如何只提取"https“包含的链接使用漂亮的汤？

要使用BeautifulSoup库从HTML文本中提取包含"https"的链接，您可以按照以下步骤操作：

首先，确保您已经安装了beautifulsoup4和lxml这两个库。如果没有，请使用以下命令进行安装：

pip install beautifulsoup4 lxml

然后，导入所需的库并创建一个BeautifulSoup对象：

from bs4 import BeautifulSoup

html_text = '''<html>
                <body>
                    <a href="https://www.example.com">Example</a>
                    <a href="http://www.example.com">Example</a>
                    <a href="https://www.example2.com">Example2</a>
                </body>
              </html>'''

soup = BeautifulSoup(html_text, 'lxml')

接下来，查找所有包含"https"的链接：

https_links = soup.find_all('a', href=re.compile(r'https'))

最后，遍历并打印提取到的链接：

for link in https_links:
    print(link['href'])

这将输出以下结果：

https://www.example.com
https://www.example2.com

如何只提取"https“包含的链接使用漂亮的汤？

、、

import requestspage = requests.get("https://evaly.com.bd/") print (link['href']) 代码的结果只需要https包含</

浏览 29提问于2020-08-17得票数 0

2回答

用漂亮的汤提取href链接的一部分

、、、

我对python请求和漂亮的汤很陌生，我试图创建一个脚本来自动登录和注销，但是我需要"_wpnonce“值来发送有效的post请求。我想知道是否有一种方法从这个链接提取"_wpnonce“值使用漂亮的汤，任何帮助都是非常感谢的。 <a href="https://www.example.com/wp-login.ph

浏览 2提问于2020-05-31得票数 2

回答已采纳

1回答

在python中，表解析是如何工作的？那个漂亮的汤有什么简单的办法吗？

、、、、

我试图了解如何使用漂亮的汤提取href链接的特定列下的内容，在一个表的网页。例如，考虑一下链接：。在这个页面中，带有类wikitable的表有一个列标题，我需要提取列标题下每个值后面的href链接，并将它们放在excel工作表中。做这件事最好的方法是什么？我在理解漂亮的汤表解

浏览 4提问于2015-04-06得票数 3

回答已采纳

1回答

使用Python从HTML网页中解析JSON

、、

我想使用Python从网站中提取数据。我以前也做过这样的事情，但是第一次我发现从这样的结构中拉了出来。它似乎是一个html页面，其底部是json。我可以使用漂亮汤获得html，但我需要提取包含数据的json。下面是我的代码示例，它使用json返回html。我最初尝试使用请求，但是脚本只是在没有发生任何事情的情况下运行就出现了问题，所以我在url

浏览 3提问于2021-04-29得票数 0

回答已采纳

1回答

如何将Beautiful soup find_all()方法限制为只有一定数量的结果？

、、

我正在创建一个网络摩天大楼，提取小企业的电子邮件。我正在用漂亮的汤来刮。本质上，该程序在google上搜索一个关键字，将前20个链接存储在一个列表中，对于每个链接，它使用漂亮的汤对其进行解析，搜索包含单词" contact“的所有href属性，进入这些联系人页面并提取电子邮件现在，我只想提取小企业网站中的</e

浏览 2提问于2020-02-29得票数 0

1回答

使用python从网站获取json字符串

、、、

有一个json字符串的链接，我似乎无法在python字典中提取出来。我尝试了一下requests库，还有漂亮汤的网站链接是link = "https://www.bloomberg.com/markets2/api/history/AAPL%3AUS/PX_LASTtimeframe=1_MONTH&period=daily&volumePerio

浏览 0提问于2020-03-08得票数 0

1回答

可以使用优美的汤找到隐藏的其他包装元素吗？

、、

我想提取的文本数据，作者从属关系在这个网页上使用美丽汤。是否有一种方法只使用漂亮的汤来提取这些信息，还是需要selenium或类似的东西来显示HTML代码中的元素？fro

浏览 3提问于2021-12-23得票数 2

回答已采纳

1回答

如何从这个html中提取链接

、、

我是HTML的新手，我正在尝试用漂亮的汤抓取一些web数据。我已经从网站上抓取了这个，并试图提取标题和链接。value = <a class="AnchorLink News__Item external flex flex-row" href="https://abcnews.go.com/Politics<div class="News__Item__Headline"&g

浏览 1提问于2020-08-13得票数 0

1回答

如何在python中将网页表格数据转换为json对象或dict

、、、、

我正在尝试从包含表的网页中获取数据，然后将表中的值与其他表值进行比较。我可以在python中将网页转换为json数据或字典吗？例如，我有url www.yahoo.com，如何将html数据转换为json？如果我尝试json.loads(data)，我得到错误raise ValueError("No JSON object could be decoded")是否有办法从网页上显示的表格中拉出数据

浏览 1提问于2016-01-22得票数 1

2回答

无法输入世界人口数字('https://countrymeters.info/en')‘

、

我试图从网站的中导入世界人口数据，但无法使用Python导入感谢和非常感谢帮助！

浏览 10提问于2022-06-02得票数 0

回答已采纳

1回答

使用BeautifulSoup抓取的数据与源代码不匹配

、、、

我是网络抓取的新手。我已经看过一些关于如何使用漂亮的汤来抓取网站的教程。作为练习，我想从一个房地产网站上提取数据。我想要抓取的特定页面是这个：我遇到的第

浏览 4提问于2021-05-02得票数 1

1回答

如何正确地修复python3中的链接列表？

、、、、

在使用了漂亮汤的soup.findAll('a', {'link': 'go to'})之后，我提取了一个链接列表，如： lis_links = ['https://foo.com/019774_s009_TEV 234.xml https://foo.com/019774_s009_TEV 23.xml https

浏览 4提问于2017-04-15得票数 1

回答已采纳

1回答

在python中为任何网页URL文档搜索特定标题的文本

、、、

我已经搜索并介绍了python中的一些网络爬行库，比如scrapy，漂亮汤等。使用这些库，我想抓取文档中特定标题下的所有文本。如果你们中的任何人能帮助我，我将不胜感激。我看过一些教程，教你如何使用漂亮的soap获取特定类名下的链接(通过查看源页面选项)，但如何获取简单的文本，而不是特定类标题下的链接。对不起，我

浏览 0提问于2017-10-25得票数 0

1回答

从美美汤中获得价值

、

我试着用漂亮的汤从中提取温度值。但是当我把汤的全文打印出来的时候，它只给我看了一个iframe： <iframe frameborder="0" height="100%" src="https://www.weatherlink.com/embeddablePage/show/c7ea9161378346e18d2e4c0ea0

浏览 1提问于2019-04-21得票数 1

回答已采纳

1回答

用漂亮汤从下面的代码中提取URL

、

data-purl="https://www.my-required-link-classic-fit-yellow-shirt.html">

浏览 2提问于2022-02-12得票数 0

2回答

使用Python提取所有超链接

、

我一直在尝试使用python中漂亮的汤从一个内部sharepoint网站中提取所有的超链接，但是每当我试图运行该程序时，结果都是零。当我检查网站的查看源时，它也没有显示任何超链接。但是，我可以在浏览器中使用检查选项看到所有的链接。有没有办法用python提取所有这些链接。代码： r=requests.get('https

浏览 8提问于2021-12-27得票数 -2

1回答

Python是包装器吗？

简单地从网页中提取信息的Python脚本(例如，使用漂亮的汤)会被称为包装器(参见https://en.wikipedia.org/wiki/Wrapper_(数据)_(采矿) )吗？

浏览 0提问于2017-03-13得票数 2

1回答

使用标签数据上的python从espn中提取数据-reactid

、、

我希望使用python从espn站点中获取一些数据。只会显示列的标题。在该链接内是数据反应链接，这些链接没有显示在urls中。如何浏览数据-反应链接？当您单击防御或攻击<em

浏览 1提问于2018-11-25得票数 0

回答已采纳

2回答

如何用美汤BS4刮<Script>标签(Python)

、、

如果你在下面的链接上查看页面源代码； https://www.zoopla.co.uk/for-sale/details/53818653?search_identifier=7e57533214fc2402ba53dd6c14b624f8 第89行具有标记<script>，其下的信息一直到行164。我正在试着用漂亮的汤提取这个，但我做不到。我可以使用下面的代码成功地提取其

浏览 32提问于2020-01-01得票数 0

1回答

Selenium未完全下载文件

、、、、

我已经用漂亮的汤、硒(铬)和蟒蛇建立了一个网络刮板。它非常简单，漂亮的汤解析了一个充满链接的页面，selenium每次遵循这些链接1。Selenium在每个页面上找到一个特定的下载链接，然后单击它，开始下载。我会用这个漂亮的汤，但如果我不使用浏览器点击链接，它将发送我到一个页面的captcha。无论如

浏览 0提问于2014-09-06得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何只提取"https“包含的链接使用漂亮的汤？

相关·内容

如何只提取"https“包含的链接使用漂亮的汤？

用漂亮的汤提取href链接的一部分

在python中，表解析是如何工作的？那个漂亮的汤有什么简单的办法吗？

使用Python从HTML网页中解析JSON

如何将Beautiful soup find_all()方法限制为只有一定数量的结果？

使用python从网站获取json字符串

可以使用优美的汤找到隐藏的其他包装元素吗？

如何从这个html中提取链接

如何在python中将网页表格数据转换为json对象或dict

无法输入世界人口数字('https://countrymeters.info/en')‘

使用BeautifulSoup抓取的数据与源代码不匹配

如何正确地修复python3中的链接列表？

在python中为任何网页URL文档搜索特定标题的文本

从美美汤中获得价值

用漂亮汤从下面的代码中提取URL

使用Python提取所有超链接

Python是包装器吗？

使用标签数据上的python从espn中提取数据-reactid

如何用美汤BS4刮<Script>标签(Python)

Selenium未完全下载文件

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐