腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
6
回答
编写
HTML
解析器
、
、
我目前正在尝试(或计划尝试)
编写
一个简单(尽可能)的程序来将
html
文档解析为树。在谷歌搜索后,我找到了许多答案,说“不要做它已经做了”(或类似的话);还提到了
HTML
解析器
的示例;还有一篇相当强调的文章,说明为什么不应该使用常规表达式。然而,我还没有找到任何关于
编写
解析器
的“正确”方法的指南。(顺便说一下,这是我尝试的一种学习练习,而不是任何东西,所以我很想这样做,而不是使用预制的) 我相信只要读取文档并将标记/文本等添加到树中,每当我命中关闭标记时,我就可以做一个工作的XM
浏览 0
提问于2011-08-25
得票数 32
回答已采纳
2
回答
用Erlang
编写
HTML
解析器
、
我对Erlang非常陌生,作为学习练习的一部分,我想用Erlang
编写
一个
HTML
解析器
。 我想要从网页中提取特定的值,也许可以使用模式来描述我想要提取的数据。
浏览 8
提问于2010-06-24
得票数 9
回答已采纳
7
回答
如何用C#
编写
解析器
?
、
、
、
如何
编写
解析器
(递归下降?)在C#?现在,我只需要一个简单的
解析器
来解析算术表达式(并读取变量?)。尽管稍后我打算
编写
一个xml和
html
解析器
(用于学习目的)。我之所以这样做,是因为
解析器
在很多方面都很有用:网页开发、编程语言解释器、内部工具、游戏引擎、地图和图块编辑器等。那么,
编写
解析器
的基本理论是什么?我如何在C#中实现
解析器
?C#是
解析器
的合适语言吗(我曾经用C++
编写
了一
浏览 0
提问于2011-09-11
得票数 68
回答已采纳
2
回答
html
搜索和替换保留的
html
标记
、
我正在寻找一个基于Java的
html
解析器
,可以搜索和替换文本保留
html
标签。这个问题以前在这里被问过,但答案似乎没有命中目标。我下载了几个
html
解析器
,并
编写
了简单的程序,看看它们是否能完成这项工作。这些包括jsoup,Jericho,Java
HTML
解析器
等,它们可以进行搜索,但当涉及到替换保留
html
标签的文本时,没有办法做到这一点。我已经阅读了这些帖子的完整帖子: 如果现在还没有这样的
解析器
,那么实
浏览 1
提问于2011-01-20
得票数 2
1
回答
PHP -设置等于外部网页的DIV内容的变量。
、
、
、
我正在制作一个氏族网站,我想动态更新从RuneS景的网站,以保持我们的家族数据最新。我计划制作一个PHP脚本,我可以每天通过cron作业执行这个脚本,它做了3件事: 我不知道如何分离出所需的DIVs (#Clanstat_1 .clan
浏览 1
提问于2013-05-12
得票数 0
回答已采纳
2
回答
使用正确嵌套的
html
上的正则表达式(或更好的建议)
、
、
、
我正在解析
html
代码片段(想想wordpress博客中的正文部分,你就不会太离谱了)。如果有比正则表达式更好的解决方案,我洗耳恭听!如果
解析器
只对整个文档起作用,或者要添加<head>等。当我拿回
html
的时候,这不是一个可接受的解决方案。
浏览 1
提问于2011-03-02
得票数 0
回答已采纳
2
回答
什么时候使用
解析器
生成器是可行的?
、
、
、
、
我正在为我正在
编写
的web应用程序
编写
一种简单的文本模板语言(想想google的ctemplate)。完成后,它将只包含少量可能的操作,像“评估并执行”、“评估并打印”、“评估并转义
html
”、“注释”之类的简单内容。我正在考虑从头开始
编写
整个
解析器
,但我开始寻找像lex、flex和antlr这样的
解析器
生成器。这些似乎比我的简单语法所需要的要多得多。所以问题是,在什么情况下使用
解析器
生成器是可行的?
浏览 0
提问于2010-08-04
得票数 5
回答已采纳
1
回答
清除混合型<script>标签
、
、
我正在使用cyberneko和xerces清理
HTML
。但是,一些$#@@!@@网站仍然同时使用这两种语言 <script>...
浏览 0
提问于2010-04-26
得票数 2
回答已采纳
1
回答
解析来自C++代码的URL
、
、
、
、
目前,我已经设法从种子URL获取
HTML
代码,该URL保存在一个字符串或文本文件中。 如何在中找到并保存我想要继续爬行的URL?
浏览 1
提问于2014-02-16
得票数 0
回答已采纳
2
回答
如何将"“改为”“
、
、
因此,我想从我的java代码正在读取的文件中替换所有的"。所以所有的“被删除,我可以写我想要的信息。例如,文件包含:如何删除"postive"public static void writeTXT(String j) throws IOException { j = j.replaceAll(
浏览 3
提问于2014-04-18
得票数 0
回答已采纳
4
回答
如何跳过格式良好性检查XML
、
、
、
我正在使用Xpath (和java)从一些网站提取信息。然而,我的问题是,由于这些网站中的一些不是很好的形式,我无法处理它们。有没有办法避免格式良好性检查,或者指定不应该检查格式良好性的标签?
浏览 0
提问于2009-02-10
得票数 2
1
回答
BeautifulSoup在两个环境中的工作方式不同
、
我在Python和BeautifulSoup4上遇到了一个有趣的问题。我的方法根据给定的餐厅(dict键)获取本地学生餐厅当天的菜单,然后显示这些菜单。 # Restaurant id's restaurants = {'assari': 'restaurant_aghtdXJraW5hdHIaCxISX1Jlc3RhdXJhbnRNb2RlbFYzGMG4Agw', 'delica': 'restaurant_aghtdXJraW5hdHIaCxISX1Jlc3Rhd
浏览 0
提问于2012-07-13
得票数 1
回答已采纳
1
回答
web从Android市场抓取应用程序信息
、
、
我想得到一个Android应用程序信息的数据集,其中包括应用程序名称、包名、版本、请求的权限等。 谢谢。
浏览 3
提问于2012-10-17
得票数 1
回答已采纳
1
回答
使用jpedal从
html
中提取超链接?--java
、
、
、
、
java中的JPedal库通常用于将pdf转换为XML或
HTML
。然而,我需要知道我们是否可以使用JPedal库API从
HTML
5文档中提取数据并将其保存到XML?有没有其他可能的替代方案?此外,我正在尝试使用Java解析
HTML
5文档,并将其存储在可扩展标记语言中。有没有什么好的解决方案可以只找到特定的标签并从中生成XML? 请务必让我知道。谢谢。
浏览 3
提问于2011-10-06
得票数 0
1
回答
如何在
html
模板中生成数组,以便在Node中创建pdf?
、
、
、
、
但是问题是我不能在
html
中创建数组中的项目列表(这将用于pdf转换)。 javascript to get the array of items, i am unable to get it. if there is a tweak to use javascript in
html
浏览 7
提问于2016-07-28
得票数 4
回答已采纳
1
回答
使用普通字符串方法的Java
解析器
HTML
?
、
、
、
、
有些
html
页面也很简单,所以我也可以使用String方法。原因是内存将是一个问题,而且加载文档也需要一些时间。在解析XML时,我总是使用SAX
解析器
,因为它不会将其加载到内存中,而且速度很快。我可以在
html
文档上使用相同的东西吗,或者已经有这样的东西了吗?因此,如果有一个非DOM
HTML
轻量级
解析器
,那就更好了。
浏览 2
提问于2012-02-23
得票数 0
回答已采纳
1
回答
有没有类似于字符串中的toHTML的方法?
、
问题是,当文本如下: dog为webview创建
html
:webView.loadData(content,"text/
html
", "UTF-8"); 我想要相同的输
浏览 1
提问于2014-01-28
得票数 0
回答已采纳
3
回答
一个快速的python
HTML
解析器
、
、
、
我写了一个python脚本,处理大量下载的网页
HTML
(120K页面)。我需要解析它们并从中提取一些信息。我试过使用BeautifulSoup,它简单直观,但运行起来似乎超级慢。在python中有没有比BeautifulSoup快得多的
HTML
/XML
解析器
?或者我必须求助于正则表达式解析..
浏览 0
提问于2012-03-13
得票数 14
回答已采纳
3
回答
在Java中漂亮的打印(“只缩进”)
HTML
文档(没有JTidy)
、
、
、
、
我们正在用引擎生成
HTML
文件。生成的
HTML
有点难看,不带有correcht缩进。我的问题: 是否有java库或其他(仅限!)漂亮打印我的
HTML
代码而不添加,从我的
HTML
文档中删除标记?它应该只做凹痕,使它看起来很漂亮的印刷!没有更多,没有更少。有什么想法吗?:
浏览 1
提问于2011-07-29
得票数 4
1
回答
扫描网站中的图像- Xcode
、
、
、
、
= [NSURLConnection sendSynchronousRequest:request returningResponse:NULL error:NULL]; NSScanner *scanner = [NSScanner scannerWithString:
html
浏览 3
提问于2014-09-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python爬虫初探:HTML解析器
html编写规范
HTML表单标签编写用户注册页面
小白必知HTML+CSS编写规范
HTML编写一个简单的网站
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券