我在html敏捷性包的帮助下解析html文件,以便从html文件中提取表数据。但是,有些html文件中没有可选的结束标记,或者没有开始标记,也就是optional.So,html敏捷性包不解析该html页面,properly.If,我在notepad++中打开该html文件的内容,然后使用选项TestFX-->TestFX HTML Tidy-->TiDy clean document
,并使内容整洁如下。现在这个文件,如果我用html敏捷性包进行解析,那么它将正确地解析它。
使html页面与notepad++保持整洁是最好的选择。
所以我不知道,但是用户不能这样做,首先他/她用notepad++整理页面,然后再去ahead.Then,我该怎么办?
,编辑,,我使用了html整洁包,但是在某些情况下,有一些文件是被整理的,没有被解析,但是如果我在notepad++中使这个页面整洁,那么它就被解析了。
发布于 2010-05-21 12:15:55
我认为Notepad++正在使用HtmlTidy库,您也可以。主页是这里。
或者您可以使用像HrmlTidy online这样的服务。
编辑:您似乎希望使用notepad++ (在HtmlTidy之上)。NP++有一组有限的命令选项,所以加载文件不会有问题。但是,我找不到接口的任何引用来完成您需要的其他工作:整理HTML和保存结果。
发布于 2010-05-21 12:14:13
HTML Tidy独立于Notepad++,您可以在.NET (或其他语言)项目中直接使用这个开源组件。
更多关于在.Net中使用此方法的详细信息,请参阅这里。
发布于 2010-05-21 12:25:50
HTML也可以单独使用,只是作为Notepad++中的插件使用。你可能想直接在你的应用程序中使用它。看看http://tidy.sourceforge.net/。许多语言的实现都是可用的。
https://stackoverflow.com/questions/2881867
复制相似问题