腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
pyquery
(
lxml
)
在
结构
良好
的
XML
文档
中
找不到
标记
?
、
、
我有一个看起来像
的
XML
文件。相关
的
比特是: <citation>Vander Wal JS, Gang CH, Griffing GT, Gadde KM.</citation></reference> from
pyquery</e
浏览 14
提问于2016-08-25
得票数 3
回答已采纳
4
回答
在
windows上安装
pyquery
、
、
我想在windows上安装
pyquery
。但是我不能在命令行上运行setup.py安装。你有什么提示吗?
浏览 2
提问于2009-12-28
得票数 4
回答已采纳
1
回答
将根元素作为变量传递
、
我有一个python函数,它接受部分
xml
字符串和根元素
标记
,并试图构造一个有效
的
xml
。我很难把这件事办好。from
lxml
import etree root_element = 'TagStatus' partial_
xml
_contents = partial_
xml
_
浏览 3
提问于2022-02-18
得票数 1
2
回答
h1-h6标签上刮擦xpath选择器
的
行为
、
、
、
、
为什么下面两个代码段提供不同
的
输出?它们之间唯一
的
区别是,第一种情况下
的
h1
标记
在第二种情况下被替换为h
标记
。这是因为h1标签在html中有一个特殊
的
“意思”吗?
浏览 2
提问于2016-12-09
得票数 0
回答已采纳
2
回答
像Python2.5
中
的
PyQuery
一样轻松地解析HTML
、
、
我正在为GAE (Python2.5)写一个应用程序,我想知道是否有像
PyQuery
(
在
Python 2.6+上运行)这样
的
库。我所要做
的
就是加载一个超文本
标记
语言文件,并通过它
的
ID获取特定标签
的
内容。
在
PyQuery
中
,甚至
在
Python2.6
的
库
中
,比如
lxml
,这是非常简单
的
,但是我不知道如何在Python2.5<em
浏览 0
提问于2010-08-29
得票数 0
回答已采纳
5
回答
使用regex或
lxml
提取Python
中
的
HTML注释?
、
如何使用Python从
文档
中提取所有HTML样式
的
注释?text = 'hello, world <!-- comment -->'更新:我
的
文档
实际上是一个
XML
文件,我正在使用
pyquery
(基于
lxml
)解析
文档
,但我
浏览 4
提问于2016-07-27
得票数 1
回答已采纳
1
回答
如何在将
pyquery
对象转换为字符串时取消转义特殊字符
、
、
、
、
我试图用python请求模块获取一个远程页面,重建DOM树,进行一些处理,并将结果保存到文件
中
。当我获取一个页面,然后将它写到文件
中
时,一切正常(我可以
在
浏览器
中
稍后打开一个html文件,并正确地呈现它)。具体来说,像&& and之类
的
特殊字符
在
保存
的
源
的
脚本
标记
中被修改(由
pyquery
的
应用程序引起),它阻止页面正确地呈现。这是我
的
代码: import requ
浏览 2
提问于2012-11-18
得票数 1
2
回答
使用
lxml
解析带有多个
xml
文档
的
文件
、
、
因此,我假设这是一个非常典型
的
用例,但我
在
lxml
文档
中
找不到
对此
的
任何支持。基本上,我有一个
xml
文件,它由许多不同
的
xml
文档
(特别是评论)组成,其
结构
大致如下: <!-- A bunch of metadata -->基本上,我试着按如下方式读取该文件: import
lxm
浏览 4
提问于2015-07-13
得票数 2
回答已采纳
1
回答
Python3 html和
lxml
解析器编码问题
、
、
、
、
当使用BeautifulSoup或
PyQuery
解析一些超文本
标记
语言时,他们会使用像
lxml
或html5lib这样
的
解析器。假设我有一个包含以下内容
的
文件
在
我
的
环境
中
,使用
PyQuery
对它们进行了错误
的
编码 >>> doc = pq(filename=PATH, parser="
x
浏览 18
提问于2018-09-01
得票数 0
2
回答
如何导航到BeautifulSoup对象
中
的
特定
标记
?
、
、
链接到我正在使用
的
url:response = requests.get(new_url)所有顶级
标记
(没有父
标记
的
标记
)似乎都是可访问
浏览 5
提问于2021-04-28
得票数 0
回答已采纳
4
回答
涉及具有属性
的
HTML
标记
的
Python web抓取
、
、
、
网页
的
框架
结构
如下:<body><div id="contents"><tbody><td class="authorBeautifulSoup和
lxml
来完成这项任务,但我不确定如何处理这两个div
标记
和td
标记
,因为它们都有属性。除此之外,我不确定是应该更多地依赖Beauti
浏览 0
提问于2009-09-08
得票数 8
回答已采纳
1
回答
在
带有python
的
html注释
中
获取表
、
我正试图解析一个
在
评论中有一个表
的
网页。我似乎不知道如何从注释
中
获取表
中
的
列和数据。到目前为止,我从html
中
得到了一个
PyQuery
文档
,如下所示:import requests table = doc('#all_info') 这使我获得了
Py
浏览 1
提问于2017-01-15
得票数 0
回答已采纳
1
回答
使用Python解析HTML,而不考虑正确
的
标记
层次
结构
、
、
、
、
我想解析一个
在
语法上是html
文档
的
文档
(使用带有属性等
的
标记
),但在
结构
上不遵循规则(例如,
在
<html>
标记
中
<div>
标记
中
可能有一个<body>
标记
)。我也不想要
XML
的
额外严格性。不幸
的
是,
lxml
只提供了document_fromstring()
浏览 4
提问于2019-10-24
得票数 0
回答已采纳
2
回答
Python
xml
.dom.minidom模式验证
、
、
、
、
是否有任何纯Python方法来使用XSD验证
XML
文件。我
的
python版本是2.x (2.6/2.7),代码已经使用
xml
.dom.minidom进行
XML
解析。
在
StackOverflow上有很多答案,但大多数都使用ElementTree或
lxml
。 有
xml
.dom.minidom
的
实现吗?
浏览 5
提问于2013-09-19
得票数 2
回答已采纳
1
回答
如何用Python重命名节点?
、
、
、
如何使用
LXML
重命名节点? 具体来说,如何在保留所有底层
结构
的
同时重命名父节点(即<body>
标记
)?我正在使用
lxml
.html模块进行解析,但据推测,
在
lxml
.html.HtmlElement和其对应
的
xml
之间重命名方面,
XML
和html之间不应该有任何区别。我
在
站点上搜索了
文档
,但没有找到任何关于节点重命名
的
引用。
浏览 2
提问于2016-04-06
得票数 5
回答已采纳
2
回答
使用DTD解析
XML
、
、
、
我正在尝试解析托管
的
USPTO数据。我还检索了与这些文件相关联
的
DTD。我
的
问题是:是否可以使用它们来解析文件,或者它们只用于验证?我已经使用了一个作为解析某些
文档
的
指导原则,但是按照我现在
的
方式,每个DTD都需要一个单独
的
解析器。下面是我目前正在做
的
一个示例代码片段。 data["Name"]= ref.find("name").text
浏览 1
提问于2014-08-06
得票数 1
1
回答
在
python
中
处理
XML
标记
中
的
数据
、
、
、
我正在尝试使用python从
XML
文档
中提取数据。</note><note> <to id="16" name="Tove"
浏览 4
提问于2017-10-25
得票数 0
回答已采纳
1
回答
Python -漂亮汤-如何处理丢失
的
结束
标记
、
、
我想用漂亮汤从html代码
中
擦掉表。html
的
一个片段如下所示。当使用table.findAll('tr')时,我会得到整个表,而不仅仅是行。(可能是因为html代码
中
缺少了结束
标记
?)> 266,67 <TD> <TD>12516714下面是我
的
浏览 2
提问于2017-04-07
得票数 4
回答已采纳
2
回答
解析HTML: Python
中
的
lxml
错误
、
、
我正在编写一个简单
的
脚本来从中获取大
的
灰色表格。movies10.aspx").read() 但我
在
最后一条语句中得到了一个错误。most recent call last): root = etree.
XML
(html) File "
lxml
.etree.
浏览 2
提问于2010-12-07
得票数 3
回答已采纳
2
回答
Urllib与elementtree结合在一起
、
、
、
在
使用标准Python库
中
的
ElementTree模块解析简单
的
超文本
标记
语言时,我遇到了一些问题。这是我
的
源代码:from
xml
.etree.ElementTree import ElementTree try:
浏览 1
提问于2012-03-13
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫基础——探索lxml库
python爬虫总结(一)
未知攻焉知防——XXE漏洞攻防
Python入门基础——爬虫开发指引
网页源码解析模块介绍及实战
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券