我正在解析一些遗留的XHTML1.1文件,这些文件采用以下一般形式:<!></html>DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstanceDOCTYPE html PUBLIC "
doms list是使用xpcshell测试实用程序中的do_parse_document解析的html文档的数组。所有文档的顶部是:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dt
我正在尝试解析一个html文档。当我使用标准xml解析器进行解析时,它将正确地写出字符,但我认为它无法解析,因为我在使用xpath搜索它时遇到了问题。<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xh