腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
无法
从
XML
解析
BS
标记
、
我在
解析
播客插曲中的图像时遇到了问题,因为这一集没有使用通常的<itunes:image>
标记
。任何帮助都将不胜感激。这是我使用的代码: import requestsfrom
bs
4 import BeautifulSoup page = requests.getpodcast['thumbnail'], 'is_
浏览 25
提问于2020-07-26
得票数 0
1
回答
如何使Python在
bs
4上正常工作?
、
、
、
我正在尝试使用4 (
bs
4)将Inkscape SVG转换成一些专有软件的类似
XML
的格式。我似乎
无法
让
bs
4正确地
解析
一个最小的示例。我需要
解析
器尊重自闭
标记
,处理unicode,而不是添加html内容。我认为用selfClosingTags指定'lxml‘
解析
器应该可以做到这一点,但是没有!去看看。 #!建议使用"
xml
“(而不是"lxml")将导致空
标记
自动自动关闭。这可
浏览 1
提问于2016-03-22
得票数 2
回答已采纳
1
回答
使用Hyphen in - Beautiful获取
标记
、
、
我正在使用漂亮的汤来尝试和
解析
一些
XML
,但是我
无法
使用find或查找所有包含连字符的
标记
,例如:尽管
XML
中有一个
标记
,worksheet.find("customized-tooltip")还是什么也不返回。如果它可能是由
解析
器问题引起的,我正在使用 soup =
bs
(contents, f
浏览 4
提问于2022-07-19
得票数 0
1
回答
如何构建html5lib
解析
器来处理混合的
XML
和HTML
标记
?
、
、
、
我正在尝试使用BeautifulSoup
解析
一个LexisNexis文件,该文件由
从
LexisNexis(合法数据库)下载的许多单独文档组成。 我的第一项任务是将HTML文件拆分为其组成文档。但是,这个<DOC>
标记
是一个
XML
标记
,而不是一个HTML (文件中的所有其他
标记
都是HTML)。因此,对于常规的HTML
解析
器,这个
标记
在树中不可用。如何在
bs
4中构建一个
解析
器来获取这个
XML</e
浏览 0
提问于2013-03-19
得票数 5
3
回答
漂亮的汤和
bs
4有什么区别?
、
、
、
、
我是python的新手,我试着
解析
一些
XML
文件,以便添加一些新
标记
并存储新的
XML
文件。python-
bs
4 - error-tolerant HTML parser for Python python-beautifu
浏览 2
提问于2015-03-27
得票数 25
回答已采纳
1
回答
BeautifulSoup
XML
解析
不起作用
、
、
、
、
我试图用BeautifulSoup
解析
XML
页面,但由于某种原因,它
无法
找到
XML
解析
器。我不认为这是路径问题,因为我过去使用lxml来
解析
页面,而不是
XML
。下面是代码:import urllib2from lxml import * BASE_URL = "http://auctionresults.fcc.gov/Auction_66
浏览 9
提问于2014-04-22
得票数 1
回答已采纳
1
回答
解析
不完整的
xml
,保持大写化
、
、
我有一个需要
解析
的
xml
片段。tag Person line 6, line 7, column 30 <Element persons at 0x11fc49908> 但是,我需要保持
标记
的大小写敏感性--我不能像html那样将它们全部降为小写:然而,使用etree失败了,所以我不得不使用html
解析
器。
标记
需要是Persons,而不是persons。我想留在lxml中,但到目前为止我找到的唯一解决方案是使用Beautiful
浏览 2
提问于2018-12-30
得票数 2
回答已采纳
4
回答
逐行读取
XML
,而不将整个文件加载到内存中。
、
、
这是我的
XML
的结构:</posts> 我可以在不将整个row文件加载到内存的情况下逐个加载每个
XML
浏览 19
提问于2022-05-05
得票数 0
回答已采纳
4
回答
如何使用BeautifulSoup访问带名称空间的
XML
元素?
、
、
、
、
我有一个
XML
文档,如下所示:<web:Web><web:Offset>0</web:Offset></
xml
浏览 0
提问于2010-06-17
得票数 12
回答已采纳
1
回答
美丽的汤返回接近标签而不是标签文本。
、
、
、
Mon, 05 Jun 2017 00:00:00 +0000</pubDate><item>如果我尝试url = i.find('link').string或url = i.find('link').content 当我打印"i“项时,它首先为链接打印一个关闭
标记<
浏览 2
提问于2017-06-14
得票数 2
回答已采纳
2
回答
使用Python中的优美汤迭代
xml
中的非href链接并检索特定信息
、
、
、
、
通常,我知道如何在典型的html源代码中检索href列表,但由于这是一个
xml
,所以我只能分离出以下格式的链接:到目前为止,我的代码给了我所有的公司链接,但我不知道如何让它通过每一个,并提取相关的信息from
bs
4 import BeautifulSoupimport re companyname = [] url1 = 'http://www.agenzia-interinale.it/sitemap-5.<em
浏览 5
提问于2013-12-18
得票数 1
回答已采纳
1
回答
XML
-
解析
R (
xml
2)中的选择性节点
、
、
我有一个
XML
输入文件。该文件包含一些事务的数据。
XML
文件如下所示:library(
xml
2)library(dplyr) d <- read_
xml
("~/CEED/sample1.dat") # read t
浏览 3
提问于2016-10-31
得票数 2
回答已采纳
2
回答
为什么BeautifulSoup要重新格式化我的
XML
?
、
、
、
BeautifulSoup(html)因此,我得到:我觉得很奇怪,因为我没有看到原始的
XML
最初,我有一个标签<b>,它包含一些文本(In Body),然后它包含另一个
标记
<b>。然而,BeautifulSoup“认为”我有
标记
<b>,在它之后(关闭之后)我有另一个
标记
浏览 1
提问于2015-02-22
得票数 2
回答已采纳
1
回答
美汤低大写标签默认?
、
、
我有一个带有大写
标记
的
XML
文档。当我使用BeautifulSoup时,它似乎是小写的标签名称,这使我使用的find_all不直观。
BS
真的是这样做的,还是发生了其他事情?soup = BeautifulSoup( features= 'lxml', # 'html5lib', # 'html.parser', #'lxml', #
xml
soup.find_all('SEC-HEADER
浏览 2
提问于2022-05-25
得票数 0
1
回答
Python BeautifulSoup给出了不同的结果
、
、
、
、
我正在尝试使用
xml
解析
一个BeautifulSoup文件。考虑一个sampleinpt
xml
文件如下:<DOCNO>1</DOCNO>from
bs
4 import B
浏览 0
提问于2015-06-06
得票数 1
回答已采纳
1
回答
BeautifulSoup抑制lxml
解析
错误?
、
、
我使用BeautifulSoup使用lxml
解析
和导航
XML
文件。from
bs
4 import BeautifulSoup soup = BeautifulSoup("<foo><bar>trololo<", "
xml
") # this will
浏览 7
提问于2016-09-16
得票数 2
回答已采纳
1
回答
从
网站中指定的div区域复制文本
、
、
我检查了源代码,我看到课程代码写在一个p
标记
中,它的类名为"results-credential“,课程名称保存在h3
标记
中。之前,我写了一个
从
浏览器读取标签名称的脚本,但我不知道如何在body中读取特定的HTML标签。
浏览 0
提问于2015-05-19
得票数 0
1
回答
我使用BeautifulSoup和Python
解析
Amazon API
XML
的缓慢方法的替代方法?
、
、
、
正如标题所说,我正在使用Python中的
BS
模块
解析
我
从
Amazon API访问的
XML
页面(我创建签名的url,用liburl2加载它,然后用
BS
解析
)。是什么让它变慢了,是
BS
解析
还是liburl加载?
浏览 0
提问于2010-07-06
得票数 0
回答已采纳
3
回答
如何使用空属性值进行.find
标记
?
、
示例HTML为了找到这个特定的标签我试过了但是它会找到所有有这个属性的标签,不管是空的还是空的。如何指定标签"div“必须有空的”样式“属性? text_area = article.find_all('div', att
浏览 4
提问于2017-09-27
得票数 1
回答已采纳
2
回答
网站不允许右键单击,web抓取不显示正文
标记
之间的文本
、
、
、
、
此外,当我打印
解析
后的html文本时,结果只有body
标记
,而不显示body
标记
中的信息。from selenium import webdriverimport urllib.request sauce = urllib.request.urlopen('
浏览 19
提问于2019-10-02
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从标识到无痕:深入解析去除企业微信标记的方法
Python网络爬虫与信息提取Week 2整理(2)
python爬虫:带你了解爬虫应当怎么做
Python3 XML 数据解析|Python XML Parsing
python-xml解析获取数据
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券