requests.get()和/或BeautifulSoup()行为不一致

文章/答案/技术大牛

发布

1回答

、、

" """acquire html from xxx and beautify the raw html""" self.beautified_html = BeautifulSoup(html.content, "html.parser") def _extract(self

浏览 11提问于2018-01-06得票数 1

1回答

Requests.content与铬检测元件不匹配

、、、

我使用BeautifulSoup和请求来抓取所有菜谱的用户数据。class="profile-review-card">URL = 'http://allrecipes.com/cook/2010/reviews/'soup = BeautifulSoup(response, 'html.parser&#

浏览 6提问于2016-04-26得票数 2

回答已采纳

2回答

BeautifulSoup -减速requests.get

、、

问题是，requests.get(url)非常快速地抓取所有东西。它们是减缓requests.get(url)的一种方法吗？import requestsresponse = requests.get(url)打印结果:当你使用这个网站时，你的浏览器或行为让我们觉得你可能是个机器人。

浏览 6提问于2021-12-09得票数 0

1回答

Python搜索网页中的元素并将其打印到不一致

、、、

然后我该如何打印超链接(或标题)以引起不一致？到目前为止，我已经设法获得了一个网站的源代码，使用：我知道我可以使用以下命令将文本打印为不一致：async def latest-release(ctx): awaitbot.say(&quo

浏览 27提问于2018-07-27得票数 0

2回答

我对在BeautifulSoup中使用带有轴组合器的CSS选择器有点困惑。下面是简单的代码来说明我的意思：import requests response = requests.get('https:'#mainbar ~ div' (发现一个兄弟)和#mainbar~div' (一无所获)也是如此。在中，这些空格是可选的，但实际上，对于相同的选择器，BeautifulSoup有不同的输出(

浏览 2提问于2018-11-20得票数 0

回答已采纳

2回答

Python3.6 BeautifulSoup不工作

、、、、

我的密码如下所示；plain_text = source_code.text或html = r.content我在编写“BeautifulSoup</

浏览 0提问于2017-03-20得票数 0

回答已采纳

3回答

Web从imdb项目中抓取特定数据

、、

我已经这样做了，但我不知道下一步该做什么 import refrom bs4 import BeautifulSoupr = requests.getref_=nv_mv_250')res = soup.find_all('strong') for x in res

浏览 18提问于2019-09-25得票数 0

回答已采纳

1回答

TypeError：‘字节’对象是不可调用的

、、

我的代码soup = BeautifulSoup(page,"html.parser")print(prices)line 6, in <module>TypeError: &#

浏览 3提问于2022-02-22得票数 -1

回答已采纳

3回答

无法使用requests.get(url)运行BeautifulSoup

、、

start_url=requests.get('http://www.delicious.com/golisoda')此代码显示以下错误：Traceback (most recent call last): soup=BeautifulSoup

浏览 3提问于2012-09-18得票数 1

回答已采纳

2回答

如何减少请求的数量而只使用一个请求？

、、

html = requests.get(r.url) return Price r = requests.get(check) bsObj = BeautifulSoup(html.content,'html.parser')

浏览 2提问于2019-03-02得票数 1

回答已采纳

2回答

使用Python解析XML时缺少字段

、、、、

以下是我的Python代码：import requestsimport csv pageText = url.textsoup = BeautifulSoup(pageText)

浏览 1提问于2014-01-28得票数 0

1回答

空元素错误与美丽汤

、、

我正在使用Beautiful解析xml文件，但是在解析空元素时发现了不一致的行为。也就是说。from BeautifulSoup import BeautifulSoups2 = "<c><a></a><b></b></c>" soup1 =Bea

浏览 2提问于2012-03-08得票数 2

2回答

BS4返回[]而不是所需的HTML标记

、、、

python和web解析新手from bs4 import BeautifulSoupdoc = BeautifulSoup(response.text, 'lxml-xml') cases = doc.find_all('div', {"class": "

浏览 12提问于2020-11-15得票数 1

回答已采纳

1回答

BeautifulSoup find_all("img")并不适用于所有站点

、、

它正在起作用，但前后不一致。具体来说，find_all("img")不是为第二个url这么做的。# http://docs.python-requests.org/en/master/user/quickstart/#binary-response-content i.save(filename) # open page, get HTML reque

浏览 5提问于2017-05-15得票数 0

回答已采纳

1回答

使用BeautifulSoup进行网页抓取时出现429错误

、、、

我正在尝试使用这些代码行来收集数据from bs4 import BeautifulSouphtml_page = requests.get(baseurl).textprint(soup) 作为输出，我没有得到预期的超文本标记语言页面，而是另一个超文本标记语言页面，

浏览 3提问于2018-08-02得票数 1

回答已采纳

3回答

“Response”类型的bs4对象没有len()

BeautifulSoup文档没有任何帮助。这似乎适用于我观看和阅读的所有教程，但不适用于我。我做错了什么？import requests这将返回Response 200，但如果我尝试添加soup...我得到了len错误： import r

浏览 1提问于2018-05-14得票数 1

3回答

BeautifulSoup如何从<a>标签中获取文本

、、

<a href="/all/views/all/" class="cmc-link">7,457</a>from bs4 import BeautifulSoupurl = 'https://coinmarketcap.com/'soup = BeautifulSou

浏览 1提问于2020-10-20得票数 0

回答已采纳

1回答

如何将被刮过的数据放到列表中

、

请帮帮忙from bs4 import BeautifulSoup page = requests.get(url)word_list

浏览 2提问于2022-05-07得票数 0

回答已采纳

1回答

python:用于知道html中的多个表的pandas方法

、

为了读取html文件中的表，我使用了pandas。 import pandas as pddf=pd.read_html(url) print(df[i]) 这是可行的。但是我正在处理大量的数据，并且不确定有多少个表。有没有一种方法可以让我们知道使用python/pandas中的任何包来知道给定html中的表的总数？

浏览 10提问于2019-03-07得票数 2

回答已采纳

3回答

属性错误'NoneType‘对象没有属性'find_all’

、

导入请求R= requests.get(')打印(soup.title) S=AttributeError回溯(最近一次调用) in () 17s= soup.find('div'，class_='entry-content') 18 --> 19行= s.find_all('p') 2021(行为行

浏览 7提问于2022-07-19得票数 -1

点击加载更多