Pandas web scraping(Beautiful soup)在带有类的标签中找到另一个带有链接的标签。然后跟随href中的链接

文章/答案/技术大牛

发布

1回答

pandas、beautifulsoup、tags

我尝试了带有特定属性的fins 'td‘标签，然后在'td’标签中找到了'a‘标签 for row in bs4.find_all('<td class="series-column"'):for link in bs4.find_all('a'): if link.has_attr('href') an

浏览 16提问于2020-09-29得票数 0

1回答

使用BeautifulSoup从<cite>标记中抓取URL

python、beautifulsoup、python-requests、bs4

for URL in soup.find_all('cite'):我以前试图通过搜索链接，然后获得链接的href来获取URL，但这种方法的问题似乎是这些URL被Google缓存，当试图访问URL时，链接经常被破坏。我注意到Google使用cite标签来保存URL。虽然这适用于绝大多数URL，但有时页面上的其他文本也包含在引用标记中。大多

浏览 4提问于2017-08-25得票数 0

2回答

下载的HTML请求与Chrome的Devtools不同

python、web-scraping、python-requests

我正试图跟随第11章中的一些代码，用Python自动化无聊的东西。然而，lucky.py的一个程序似乎对我不起作用。该程序应该使用请求模块获取特定主题的Google搜索页面，然后在不同的选项卡中打开前5个搜索结果。当我查看Chrome的搜索页面时，我非常清楚，每个搜索结果链接(<a>标记)都在一个div中，其中有一个类'r‘

浏览 4提问于2019-06-06得票数 0

回答已采纳

2回答

漂亮汤还错了href值

python、beautifulsoup、python-requests、href

我使用下面的代码为SERP做一些SEO，但是当我尝试读取href属性时，我得到了显示页面中其他有线URL的不正确结果，但没有显示预期的结果。我的密码怎么了？q=beautiful+soup&rlz=1C1GCEB_enIN922IN922&oq=beautiful+soup&aqs=chrome..69i57j69i60l3.2455j0j7&sourceid=chrome&ie=UTF-8&q

浏览 5提问于2021-11-16得票数 0

回答已采纳

1回答

用BeautifulSoup导航

python、html、beautifulsoup、html-parsing、python-requests

BeautifulSoup source = requests.get(url)soup= BeautifulSoup(source.content, "html.parser") for a in soup.findAll('a'): print a.get("

浏览 5提问于2015-10-29得票数 8

回答已采纳

1回答

如何将特定链接存储为列表，然后单击它们

python、html、list、matrix、web-scraping

我一直在关注一个关于如何通过网络抓取网页http://kanview.ks.gov/PayRates/PayRates的教程。纪念碑可以在这里找到：https://medium.freecodecamp.org/better-web-scraping-in-python-with-selenium-beautiful-soup-and-pandas-d6390592e251我唯一的问

浏览 28提问于2019-03-25得票数 1

1回答

无法通过python和Beautiful* Soup抓取google专利URL*

python、beautifulsoup、google-patent-search

我目前正试图在这个页面上抓取一个指向谷歌专利的链接，，但当我试图打印出所有带有'a‘标签的链接时，只出现了一个无关的网站。到目前为止，我的代码如下：soup = BeautifulSoup(requests.get(url).

浏览 15提问于2021-06-03得票数 1

2回答

查找href值，用漂亮的汤按类过滤

python、python-3.x、beautifulsoup

我有一个有“一个类”链接的页面源，如下例所示。我想返回一个包含所有“href”值的列表，所以在下面的"/detail/Request-Technology%2C-LLC-Oakland-CA-94609/napil006/cyberMan”.示例中，我使用了漂亮的汤，find_all试图使用‘a class’属性，但是它什么也不返回。来源： <a class="web-btn-link

浏览 1提问于2019-02-24得票数 0

回答已采纳

4回答

从具有特定类的<div>标记中获取所有<a>标记

python、web-scraping、beautifulsoup

我在“使用python自动化无聊的东西”一文中调试和获取lucky.py代码。这里的主要问题是作者的代码不工作(可能是过时的)。代码的目的是在执行python脚本时传递命令行参数。该脚本在新选项卡中打开参数的前五个(或更少) Google搜索结果。现在，原始代码提取带有'r‘类的所有标签。然而，现在，google不再使

浏览 0提问于2019-07-31得票数 0

1回答

如何使用beautifulSoup对堆栈溢出问题进行web抓取标记？

python、beautifulsoup

for link in soup.find_all('a', {'class': 'post-tag'}): # href = link.get('href') for在从堆栈溢出站点提取数据时，我们在抓取问题的标签时遇到了问题。我们可以抓取标签，但它们不会显示在问题中。问题是，对于每个问题，类是不同的，例

浏览 0提问于2018-03-17得票数 0

1回答

如何使用从selenium检索到的元素？

selenium、selenium-webdriver

如何有效地使用从Selenium检索到的存储在变量中的元素？我使用的是python。在下面的程序中：from selenium.webdriver.common.bymatching_threads.append(i)print(matching_threads) driv

浏览 21提问于2021-02-18得票数 0

回答已采纳

1回答

Google域的Web抓取

python、web-scraping

我试图从前100个结果中获得一个域列表：我使用以下代码：from bs4 import BeautifulSoupKHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}soup=BeautifulSoup(source,"html.parser"

浏览 1提问于2019-03-27得票数 0

回答已采纳

1回答

Python多层web抓取

python、web-scraping、beautifulsoup、scrapy、pycharm

我想要遍历这个列表()上的每个网址，然后复制数据并返回到下一个的根列表。我可以从单个页面抓取，但不能抓取多个链接。

浏览 2提问于2019-11-24得票数 2

1回答

使用Selenium- PYTHON打开搜索结果

python、selenium

class package-snippet openurl = 'https://lazada.com.ph' + tabs[i].get('href

浏览 8提问于2020-10-15得票数 1

1回答

如何解析google搜索中的特定链接

html、python-3.x、html-parsing

我正在写一个程序，自动打开一些浏览器标签与谷歌搜索的结果。谷歌总是首先显示购物结果，然后绘制结果地图，然后链接到其他网站。我只想拿到其他网站的链接，不包括地图链接和购物结果。我使用开发人员工具检查了这些链接，它们似乎都是元素中元素的一部分。我尝试使用带有CSS选择器的select()方法来获取这些元素，但是我无法获取这些特定的类。我已经在其他类似

浏览 0提问于2019-07-10得票数 0

1回答

锚标记不适用于一个导航条元素

javascript、html、css、navbar、anchor

所有肚脐链接工作方式，我喜欢他们，除了‘联系’。我想知道这是否与视差效应有关？我需要在导航栏中点击三次“联系人”才能到达联系人部分。我尝试在联系人标题的顶部添加div标记，就像我对“关于和服务”部分所做的那样。我也试过把不同的东西锚定在接触区周围，但什么也没有。我已经粘贴了我的整个页面，这样有人就可以直观地看到正在发生的事情，并看到什么可能是问题。<!<a href="#traditional_top" i

浏览 3提问于2022-12-03得票数 0

1回答

无法在python上使用requests-html库运行JavaScript

javascript、python-3.x、python-requests-html

我需要从一些包含javascript代码的链接中提取一些信息。我知道如何使用Selenium，但这需要很多时间，我需要更有效的方法来完成这项工作。-YLEF4c'}) print(email) 运行这段代码后，我没有得到任何结果，即使类存在，如果我从我的浏览器打开链接。我还尝试在没有帮助的情况下对我的请求使用头文件。我为另一个链接(https://web</em

浏览 106提问于2020-01-24得票数 1

1回答

被美人汤卡住了

python、beautifulsoup

它有新奇的章节，我正在尝试获取文本并将其存储在文本文件中以便离线阅读。我以前也没有使用html或其他东西的经验。所以我要抓取的网页是。")[0]["style"]) # help = soup.find_all("divWeb scraping is now c

浏览 0提问于2021-11-23得票数 0

2回答

Angular 5路由问题(重定向回主页)

angular、routing、routes

我在Angular 5项目中遇到了一个问题。我正在尝试从我的LocationDetailComponent导航到ClientListComponent。我在LocationDetailComponent中的HTML代码中包含以下内容：(click)="seeClients(ap.name);"> {{ ap.details.apclientcount，然后它会

浏览 0提问于2018-03-07得票数 0

2回答

如何使用BeautifulSoup在html中刮取链接

python、beautifulsoup、scrape

我需要下载几个链接在一个html。但我不需要他们全部，我只需要他们中的少数在这个网页的某些部分。例如，在中，我需要在辩论部分的链接。我计划使用BeautifulSoup，并查看其中一个链接的html： <a href="/roomfordebate/2014/09/24/protecting-student-privacy-in-on

浏览 5提问于2014-10-12得票数 0

回答已采纳

点击加载更多