腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
浏览器在脚本和链接标记位置不同的呈现行为
、
、
、
、
案例B:图像-B 案例B解释:
浏览 1
提问于2015-10-29
得票数 6
回答已采纳
1
回答
'BeautifulSoup‘和'lxml’之间有什么关系?
、
、
、
在“lxml's ”中,它写道: 美丽的Soup支持Python标准库中包含的
HTML
解析器
,但它也支持许多第三方Python<
浏览 2
提问于2015-08-25
得票数 3
回答已采纳
1
回答
HTML
解析器
和CSS
解析器
是否并行工作?
、
、
当涉及到呈现页面时,我们知道有一个解析
HTML
的
HTML
解析器
和一个解析CSS的CSS
解析器
。 那么,它们是平行工作的吗?我认为
HTML
解析器
和CSS
解析器
属于GUI呈现线程,因此它们只能串行工作。
浏览 4
提问于2021-10-24
得票数 0
2
回答
内建的Regex类或Parser.How来从
html
文件中提取标记之间的文本?
、
、
我有
html
文件,其中包含c#.net应用程序中的表、内容和其他信息。 我只想解析一些columns.Then的表内容,应该使用
html
解析器
还是替换.net中的Regex的方法?如果我使用
解析器
,那么如何使用
解析器
呢?
解析器
会提取标签之间的信息吗?如果是,那该如何使用?如果可能的话,请展示这个示例,因为我对
解析器
并不熟悉。编辑:我想从
html
文件中的表中提取信息。为此,我如何使用
html
敏捷性
解析器
?我应该写什么类
浏览 8
提问于2010-03-03
得票数 0
回答已采纳
1
回答
AEM资源
解析器
失败
、
我正在处理AEM资源
解析器
,我目前在Adobe资源
解析器
工厂上有以下配置。='/content/mywebsite/android.
html
' href=<a data-desktop='/desktop.
html
' data-adroid
浏览 0
提问于2015-11-16
得票数 1
1
回答
使用BeautifulSoup进行网络抓取返回NoneType
、
page = requests.get("https://gematsu.com/tag/media-create-sales") soup = BeautifulSoup(page.text, '
html
.parser
浏览 1
提问于2019-01-18
得票数 3
回答已采纳
3
回答
用于PHP的
Html
解析器
,如Java
、
我一直在开发Java程序,通过使用不同的
html
解析器
来解析网页的
html
源代码,比如Jericho,NekoHtml等。 现在我想用PHP语言开发
解析器
。所以在开始之前,我想知道有没有可用的
html
解析器
,我可以用PHP来解析
html
代码。
浏览 1
提问于2010-02-17
得票数 3
回答已采纳
2
回答
html
搜索和替换保留的
html
标记
、
我正在寻找一个基于Java的
html
解析器
,可以搜索和替换文本保留
html
标签。这个问题以前在这里被问过,但答案似乎没有命中目标。我下载了几个
html
解析器
,并编写了简单的程序,看看它们是否能完成这项工作。这些包括jsoup,Jericho,Java
HTML
解析器
等,它们可以进行搜索,但当涉及到替换保留
html
标签的文本时,没有办法做到这一点。我已经阅读了这些帖子的完整帖子: 如果现在还没有这样的
解析器
,那么实现
解析器<
浏览 1
提问于2011-01-20
得票数 2
1
回答
简单的
HTML
DOM
解析器
html
5
、
、
我不能用简单的DOM
解析器
解析
HTML
5元素:$
html
->find( 'header' );不返回任何内容:/或者你有其他的
解析器
吗?(我需要通过
HTML
标签选择/提取/删除(div,span,a,img,footer...)或/和
HTML
类或/和
HTML
浏览 0
提问于2014-12-16
得票数 2
1
回答
美汤不能FindAll
、
相反,它会打印:12, 2515, 25 17, 2515, 25查看
html
源代码显示,每页应该返回25个结果,但Beautifulsoup
浏览 5
提问于2015-06-06
得票数 5
回答已采纳
1
回答
符合
html
5的
解析器
是否正确地处理
html
4和更高版本?
、
、
、
与XHTML不同的是,XHTML脱离了向后兼容性,采用
解析器
对格式错误的标记不那么宽容的方法,
HTML
5承认格式错误的
HTML
代码已经大量存在,并可能继续使用,并认为应该扩展规范以确保与此类代码的最大兼容性因此,
HTML
5规范改变了它对
HTML
语法的定义,既适应了当前使用的通用语法,也明确描述了
解析器
应该如何处理“格式错误的代码”。现在,处理格式错误的代码在规范本身中占有一席之地,希望减少未来
HTML
解析器
实现额外的、不规范的方法来处理它不认识的代码
浏览 7
提问于2016-12-03
得票数 0
回答已采纳
1
回答
在BeautifulSoup 4中将标签内容提取为文本(相当于QUOTE_TAGS)
、
、
HTML
3有一个很好的特性,那就是它不会试图将<textarea>标签的内容解释为BeautifulSoup --它会将其引用为文本。通过修改QUOTE_TAGS属性,可以将此行为应用于其他标记。在BeautifulSoup 4中,没有QUOTE_TAGS属性,我认为如果不自己创建
html
.parser子类,就无法获得相同的功能。我是不是遗漏了什么?您将如何使用BS4解决上面链接的问题?
浏览 1
提问于2013-05-01
得票数 1
1
回答
配置自动关闭标签
、
、
、
<
html
li> 1</ul>""" 在这里,这个脚本的输出: <body> <li> <li> </li> <
浏览 1
提问于2014-04-09
得票数 0
回答已采纳
1
回答
Python3,BeautifulSoup删除段落标记
、
、
、
、
如果有下面的
html
块:当我做以下事情时:soup = BeautifulSoup(chunk)>>> soup <
html
><body><p>BLA bla bla
html
...</p><div>
浏览 2
提问于2014-08-11
得票数 2
回答已采纳
1
回答
beautifulSoup不一致行为
、
、
、
、
我对在两个不同的环境中编写的以下
HTML
代码的行为完全感到困惑,需要帮助找到造成这种差异的根本原因。__version__)) url = 'http://www.ncbi.nlm.nih.gov/Traces/wgs/?same string was downloaded print "MD5 sum for
html
string downloaded is %s" %md5.new(
ht
浏览 5
提问于2015-09-18
得票数 2
回答已采纳
1
回答
BeautifulSoup:如何忽略虚假的结束标记
、
、
、
我读过很多关于BeautifulSoup的好东西,这就是为什么我现在正试图用它来刮一组格式错误的
HTML
的网站。而且,在本例中,find方法似乎没有搜索(自诱导的) </
html
>标记后面的内容。这意味着当我感兴趣的块恰好在虚假结束标记后面时,我无法访问内容。
浏览 1
提问于2015-12-19
得票数 7
回答已采纳
1
回答
你能用XML
解析器
解析
HTML
吗?
、
、
、
我希望为
HTML
获得一个C++
解析器
,但似乎只有c++
解析器
,各种来源都暗示了一个事实,即xml
解析器
可以解析c++,但我找不到任何具体的信息,说明XML可以解析
html
。如果您可以用它来解析
HTML
,为什么如果它们是不同的语言,而我不认为
html
是XML的子集,为什么会这样呢?
浏览 6
提问于2015-11-19
得票数 1
回答已采纳
1
回答
为什么这个
解析器
找不到使用名称空间前缀的XML标记的内容?
、
、
、
、
pubDate>Sat, 12 Oct 2019 17:03:11 +0000</pubDate> </channel>当我尝试使用lxml解析它并遵循时,
解析器
会找到标题(它不使用名称空间),但找不到作者/创建者,它会:<?<pubDate>Sat, 12 Oct 2019 17:03:11 +0
浏览 2
提问于2019-10-12
得票数 2
回答已采纳
2
回答
寻找java
html
解析器
,如PHP中的简单
html
dom。
、
、
、
、
我正在寻找java
html
解析器
(我很了解java和我糟糕的PHP -这样我想了解
html
解析器
是如何工作的)简单的
html
dom在php中。 谢谢
浏览 2
提问于2010-07-06
得票数 2
回答已采纳
1
回答
BeautifulSoup4缺失标签
、
、
、
如果我错了,请纠正我--我理解BeautifulSoup是用来将格式不正确的
HTML
转换成格式良好的
HTML
的库。但是,当我将
HTML
赋值给它的构造函数时,我损失了一半以上的字符。它不应该只是修复
HTML
而不是清理它吗?在中,它不是很好的描述。这是代码:soup = BeautifulSoup(
html
)可能是因为我通过str(soup)检索
HTML</em
浏览 2
提问于2015-03-12
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python爬虫初探:HTML解析器
基于.Net开源Html解析器,此外还支持SVG、XML等格式
数据分析师的编程之旅——Python爬虫篇(2)HTML解析器
Python Python解析器
C+实现xml解析器
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券