腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
如何
从
我
漂亮
的
soup
结果
中
删除
标签
(
如
:
Address
= [a,
b
,
c
,
d
,
r
……])
、
、
如何
从
我
的
漂亮
的
like
结果
中
删除
标签
(
如
:
Address
= a,
b
,
c
,
d
,
r
……) from bs4 import BeautifulSoup as bs import requests= 'https://www.planetware.com/tourist-a
浏览 63
提问于2019-06-05
得票数 1
回答已采纳
3
回答
为什么在浏览器开发工具与BeautifulSoap / Postman之间获取不同
的
数据?
、
、
、
、
我
想从这个网页上
删除
数据。在浏览器工具
中
,它显示在
结果
标签
下面,有10个片段. <div class="results">在邮递员身上..。
我
就是这么做
浏览 10
提问于2022-03-23
得票数 2
回答已采纳
1
回答
使用BeautifulSoup ()移除重复
的
urls set会拆分这些urls
、
、
、
在python
中
,
我
使用BeautifulSoup从一个项目的网站上抓取urls,一切都很正常,直到我试图通过将
标签
传递到一个set对象
中
来
删除
重复
的
内容。
标签
被“炸开了”。以下是
我
的
代码和打印
结果
的
示例。,'\n','
c
','>','u','"','-
浏览 7
提问于2019-02-24
得票数 1
1
回答
如何
选择一个带有
漂亮
汤
的
div里面的类div?
、
">Not this</div><div class="bar">Don't want this either所以我用python和
漂亮
的
汤把东西分开。只有当"bar“类被包装在"foo”类div
中
时,
我
才需要它。这是
我
的
代码
soup
浏览 0
提问于2014-03-06
得票数 15
回答已采纳
1
回答
美丽
的
汤:把文字放在
标签
里
、
、
我
正在尝试使用
漂亮
汤
从
html文件中提取字符串。一个带有
标签
标签
的
查询回复,
我
如何
摆脱这些
标签
。from bs4 import BeautifulSoup
soup
= BeautifulSoup(html_file, 'lxml
浏览 1
提问于2021-02-12
得票数 1
回答已采纳
2
回答
如何
用美汤BS4刮<Script>
标签
(Python)
、
、
search_identifier=7e57533214fc2402ba53dd6
c
14
b
624f8 第89行具有标记<script>,其下
的
信息一直到行164。
我
正在试着用
漂亮
的
汤提取这个,但我做不到。
我
可以使用下面的代码成功地提取其他
标签
,
如
"h2"/"Div“等: 来自页面源代码
的
第1,028行。for item_name in
soup
.f
浏览 32
提问于2020-01-01
得票数 0
1
回答
在BeautifulSoup中使用展开时,
删除
的
标签
不会被彻底
删除
、
在使用unwrap()之后,
我
使用分隔符(get_text= "\n")来分别获取所有段落。BeautifulSoup(string,"lxml")result = string.get_text(separator = "\n")
我
希望
结果
只有第一行是paragraph1,第二行是paragraph2paragraph1 paragraph1 para
浏览 2
提问于2017-12-12
得票数 1
1
回答
在python中使用
漂亮
汤时无法在Amazon上获得产品
的
价格
、
、
、
、
我
试着用
漂亮
的
汤来跟踪产品
的
价格,但是每当我尝试运行这个代码时,
我
就会得到一个6位数
的
代码,
我
认为这与recaptcha有关。
我
试了很多次,检查了标题、url和
标签
,但是似乎没有什么效果。= "https://www.amazon.in/Razer-Basilisk-Wired- Gaming-RZ01-04000100-
R
3M1/dp/
B</em
浏览 12
提问于2022-11-28
得票数 0
回答已采纳
1
回答
基于十六进制字符串模式
的
网页抓取
、
、
我
需要搜索十六进制字符串模式
的
url,并将其添加到url中正在抓取的当前数据。
我
确实尝试了一些方法,但不起作用。下面是成功捕获少量数据
的
工作代码片段。/0xe1fd7
b
4
c
9debac3
c
490
d
8a553
c
455da4979482e4#readContract" req = requests.get(url,header, timeout=10)(STACKDOGE) 想要
的
输出: Contra
浏览 14
提问于2021-09-13
得票数 0
1
回答
将html
中
的
br标记替换为空格逗号,完成python美汤后
、
、
br /> (不带.)每行之间
的
标签
,例如29 BOSWALL PARKWAYEH5 2BR.当我在这个文本编辑器
中
写
的
时候,它们
的
标签
就消失了。当我把
漂亮
的
汤输出看起来像29 BOSWALL PARKWAYEDINBURGHEH5 2BR第一个方法在扫描字符串文本错误时生
浏览 0
提问于2017-03-10
得票数 0
1
回答
BeautifulSoup
从
html文件
中
剥离不完整
的
</tr>标记
、
、
我
正在试着
从
html文件
中
删除
所有的脚本
标签
。问题是html文件在某些情况下没有表格行
的
开始
标签
(在行尾只有
标签
),因为它们是不完整
的
,所以
漂亮
汤似乎正在
删除
它们。
结果
,这会打乱表格
的
格式。有没有其他方法可以在不弄乱格式
的
情况下
删除
这些脚本标记?root_dir).iterdir(): if path.is.file()
浏览 29
提问于2021-11-04
得票数 0
1
回答
如何
从
抓取数据创建各种列表
、
我
正在努力改进下面的代码。
我
想从正在抓取
的
同一数据文本
中
向列表
中
添加
标签
。', headers = {'User-Agent':'Mozilla/5.0'}) test =
soup
.select_one('divunlockTime,
address
withdra
浏览 3
提问于2022-04-19
得票数 1
回答已采纳
1
回答
如何
使用Beautiful
soup
解析htm文件
、
、
print(
soup
)<html><body><p>t a
b
l e i
d
= " T a
b
l a
D
a t a "
c
l a s s = " T a
b
l a w i
d
t h = " 9 0 % &g
浏览 2
提问于2018-08-24
得票数 0
11
回答
使用BeautifulSoup移除标记,但保留其内容
、
目前,
我
有这样
的
代码: if tag.name not in VALID_TAGS:
soup
.renderContents() 除非我不想丢弃无效标记
中
的
内容。
如何
在调用
soup
.renderContents()时去掉标记,但又保留内容?
浏览 0
提问于2009-11-20
得票数 59
回答已采纳
1
回答
使用
漂亮
汤
的
数据格式
的
问题
、
、
、
我
使用
漂亮
的
汤抓取数据创建了一个数据文件。然而,有两个问题。 import bs4import pandas as pd root = requests.g
浏览 2
提问于2020-09-26
得票数 1
回答已采纳
2
回答
C
中
的
内存分配过程?是自上而下还是自下而上?
、
、
、
、
, *
r
,*t; char s='o'; printf("
address
of
b
=%u\n",q); printf(&q
浏览 3
提问于2014-01-23
得票数 0
4
回答
Beautiful查找给定属性
的
所有值,而不指定标记
、
、
有没有办法获得某个属性
的
所有值? 示例: <a title="title-in-a"> <
c
title="title-in-
c
"> ... </
c
> <
d
name="i-dont-care"> ...<
浏览 51
提问于2019-05-10
得票数 4
回答已采纳
5
回答
如何
在不进一步嵌入标记文本
的
情况下获取HTML标记
中
的
文本?
、
我
试图使用BeautifulSoup解析页面上
的
地址列表。当我找到一个带有文本和嵌入标记
的
标签
时,
我
如何
只
从
标签
中
获取文本,而不会在任何更低级别的嵌入文本
中
获取文本呢?
我
使用pTag在.html页面
中
从一个位置到另一个位置,下面是我处理
的
代码:并接收页面代码<
浏览 10
提问于2011-12-29
得票数 2
回答已采纳
0
回答
分离标题和正文
的
美汤
、
、
我
有一些代码,它解析出一个div从一个页面,然后找到所有的"p“
标签
,将有一个标题和一些文本for fn in os.listdir('.'): print(text=True)
浏览 0
提问于2017-01-07
得票数 1
回答已采纳
2
回答
在html
中
逸出
的
漂亮
汤
、
我
试图
从
文件
中
读取行,并尝试使用
漂亮
的
汤将其放入html
中
。每一行都将被追加到一个列表
中
,使用for循环,
我
将它们添加到字符串
中
,并在行
的
每一端添加'\n‘。例如,string = '' string = string + line + '\
浏览 7
提问于2022-11-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python爬虫知识小结
Python学习-BeautifulSoup简单爬虫
以太坊·将数据写入到区块链中
自从看了这篇文章,再也不用担心爬不到心仪女神的图片了!
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券