腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Lxml
-如
何在
标记
中
包装
所有
出现
的
特定
文本
html
、
parsing
、
lxml
</div> 我需要将“foo”
的
所有
匹配项
包装
在一个可点击
的
链接(<a>元素)
中
,除了已经在<a>
中
的
那些匹配项,因此预期
的
输出是: <div> Some <a>foo</a> text</div> 使用
lxml
有什么简单
的
方法可以做到这一点吗?最初,原始子字符串替换对我来说更有意义,但有一
浏览 15
提问于2019-03-08
得票数 1
1
回答
没有根
标记
时使用
lxml
进行html解析
python
、
lxml
、
formalchemy
具体地说,formalchemy.FieldSet.render()返回一个没有根
标记
的
html片段,而我似乎不知道如何让
lxml
将其解析成可以包含在元素树
中
的
内容:>>>
lxml
.etree.fromstring_parseMemoryDocument (src/
lxml
/
lxml
.etree.c:79932) File "parser.pxi", li
浏览 4
提问于2012-04-16
得票数 3
回答已采纳
2
回答
lxml
使用元素移动
文本
python
、
html
、
lxml
我有一个问题与
包装
图像与div。from
lxml
.html import fromstring<span><div><img src="/img.png"/> some text</div>
浏览 0
提问于2013-07-18
得票数 1
1
回答
如何通过
lxml
检索标签内
的
文本
?
parsing
、
web-scraping
、
lxml
、
lxml.html
我使用
lxml
在
标记
中
获取
文本
,并且这样做。xpaths_for_questions_
lxml
= [] try: xpaths_for_questions_
lxml
.append(self.tree.getpathlabel 时,tag.text属
浏览 0
提问于2018-10-11
得票数 0
1
回答
lxml
删除
标记
中
未
包装
的
文本
。
python
、
lxml
下面是我用
lxml
编写
的
python代码from
lxml
import etreefrom copyimport deepcopyfrom
lxml
import html some_xml_data = "<span>text1<div>ddd<看起来,在我对
lxml
树(删除一
浏览 1
提问于2016-07-29
得票数 1
回答已采纳
1
回答
使用minidom从节点列表
中
删除第一个和最后一个节点
python
、
xml
、
dom
、
xml-parsing
、
minidom
文件中使用了许多自定义
的
实体,因此使用
lxml
是一件很痛苦
的
事情。DOM似乎忽略了这一点,因此在我目前
的
工作
中
,我使用了DOM。 我需要从一个<para>
中
获取
所有
的
标记
和
标记
中
的
所有
内部
文本
。然后,我需要删除
标记
的
第一次
出现
和最后一次
出现
,并获得其余
标记
浏览 4
提问于2018-07-23
得票数 0
2
回答
无法使用BeautifulSoup提取即时级别
中
的
文本
python
、
beautifulsoup
我遵循这个方法,通过使用find(text=True, recursive=False)从
标记
的
直接级别提取
文本
,就像在另一个中提到
的
那样,但是对于某些
特定
的
标记
,
如
u'<p>\n <strong>\n代码如下: markup = u'<p>\n <strong>\n Established\n </strong>\n 1865\n</p>
浏览 1
提问于2016-10-23
得票数 3
1
回答
使用
LXML
获取
所有
HTML元素
python
、
html
、
parsing
、
lxml
我正在尝试解析我
的
超
文本
标记
语言文档
中
的
一个大
的
div
标记
,并且需要在div
中
获得它
的
所有
超
文本
标记
和嵌套
标记
。我
的
代码:print("The tags inside the target div are") print innerTree
浏览 12
提问于2017-02-17
得票数 0
1
回答
使用
lxml
解析html部分模板
python
、
lxml
我试图使用
lxml
解析html模板,并将某些属性添加到html元素
中
。我注意到我
的
模板包含额外
的
标记
,使其成为一个有效
的
html模板。
包装
模板,
如
<span> A template </span>使用html和body
标记
,将其转换为类似于 <body>
浏览 4
提问于2014-01-31
得票数 2
回答已采纳
2
回答
如何从URL
中
删除HTML、CSS和Javascript代码
javascript
、
python
、
html
、
beautifulsoup
我想从一个网址
中
删除
所有
的代码,只得到
文本
。我正在尝试用这些代码来做这件事,但是我还没有得到我想要
的
东西,因为我仍然有javascript代码。print(soup.html.string) print("string: " + repr(string)) 我得到
的
一个例子是exception occurred while adding idcta labels to istats, invoking i
浏览 41
提问于2018-07-05
得票数 0
2
回答
lxml
不能解析<table>?
python
、
parsing
、
lxml
、
web-crawler
我想在html
中
解析表,但是我发现
lxml
不能解析它?怎么了?# -*- coding: utf8 -*-import
lxml
.etree content = f.read() f.close
浏览 1
提问于2010-11-04
得票数 1
2
回答
Python XPath SyntaxError:无效谓词
python
、
xml
、
xpath
paragraph>ash</paragraph> </page> </document> raise SyntaxError("invalid predicate")我
的
浏览 11
提问于2015-11-20
得票数 12
回答已采纳
2
回答
如何删除不带尾
的
lxml
节点中
的
标记
?
python
、
beautifulsoup
、
html-parsing
、
lxml
//b)]html = <a>Text2</a>[bad.getparent().remove(bad) for bad in html.xpath(".//b")]html = <a></a>如果我们只需要
标记
联接
中
的</em
浏览 0
提问于2017-03-21
得票数 8
回答已采纳
2
回答
试图使用Python从
标记
中提取“
文本
”
python
、
html
我试图在这个页面的第一列()上提取代理IP号,例如:"178.33.62.155“,但是当我试图提取相关标签上
的
所有
文本
内容时,它不会得到Ip
文本
。网站上
的
html标签是: <td align="left"><script>document.write('23178.3'.substr(2) + '3.62.155');</script>178.33.62.155</td&g
浏览 3
提问于2017-05-14
得票数 1
回答已采纳
1
回答
在使用
lxml
剥离html
标记
时插入空格
python
、
html
、
beautifulsoup
、
lxml
当我剥离标签并使用
lxml
提取
文本
时,我希望在结果
文本
中
插入空格。import
lxml
return str(
lxml
.html.fromstring(</p>" BeautifulSoup(s, "
lxml
").get_text(separat
浏览 1
提问于2022-04-13
得票数 0
回答已采纳
2
回答
用jquery/javascript替换选定
的
文本
javascript
、
jquery
、
wysiwyg
我试图在浏览器
中
构建一个专门
的
WYSIWYG
文本
编辑器,功能非常有限,但其中最大
的
部分是将某些
文本
包装
在span标签
中
。我可以找到很多资源来解释标准
的
东西(execCommand和诸如此类
的
东西),但是我找了又找,都找不到任何我需要
的
东西。基本上,它就像听起来一样简单:用户选择一些
文本
,单击一个按钮或其他任何东西,
文本
就会被其他
文本
替换(最初
的
情
浏览 0
提问于2009-07-07
得票数 5
回答已采纳
2
回答
使用etree搜索整个树
python
、
xml
我正在使用xml.etree.ElementTree作为ET,这似乎是一个很好
的
库,但如果有其他/更好
的
工作,我很感兴趣。subsubthird>findme</subsubthird></third></top>""" 为了解决这个问题,我们假设它已经在一个名为myTree
的
元素树
中
我想把findme更新到fo
浏览 3
提问于2016-01-02
得票数 0
1
回答
如
何在
保留span
标记
的
同时,在conteteditable中键入和删除预跨
包装
文本
中
的
文本
javascript
、
jquery
、
html
、
css
有人知道如
何在
内容可编辑
的
div
中
插入和删除预跨
包装
文本
中
的
文本
,同时保留<span id="x">
标记
吗? 在内容可编辑
的
div
中
,如果删除"kachu",<span id="2">也将被删除。即使没有
文本
,我也希望这个
特定
的
标记
仍然存在。
浏览 2
提问于2016-04-17
得票数 0
3
回答
删除自动生成
的
<p>
标记
wordpress
我有谷歌为其提供解决方案,
如
移除过滤器remove_filter( 'the_excerpt', 'wpautop' );当我将纯
文本
放在页面内容
中
时,
如
将这些纯
文本
包装<
浏览 5
提问于2014-04-04
得票数 0
1
回答
使用Python解析XML文件
中
的
数据
python
、
xml
、
xml-parsing
我有一个xml文件,其中我需要剥离xml
标记
,如果可能的话,我可以使用通配符,因为
标记
中
的
数据将是不同
的
信息。different for each grouping**** <label/>基本上,我需要在xml文件
中
搜索分组,并在
标记
中使用通配符,然后删除整个分组。在我
的
xml
中
浏览 0
提问于2011-07-09
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用XPath进行网页爬取的Python实现
python教程|如何批量从大量异构网站网页中获取其主要文本?
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
用python3教你任意Html主内容提取
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券