运行下面的代码时,我得到了这个错误:Fatal error: Uncaught exception 'DOMException' with message 'Invalid Character Error' in test.php:29 Stack trace: #0 test.php(29): DOMDocument->createElement('1OhmStable', 'a') #1 {main} thrown in test.php on line 29
原始XML文件中的节点确实包含无效字符,但是当我从节点中剥离无效字符时,应该创建这些节点。我需要对原始XML文档进行哪种类型的编码?我需要解码saveXML吗?
function __cleanData($c)
{
return preg_replace("/[^A-Za-z0-9]/", "",$c);
}
$xml = new DOMDocument('1.0', 'UTF-8');
$xml->load('test.xml');
$xml->formatOutput = true;
$append = array();
foreach ($xml->getElementsByTagName('product') as $product )
{
foreach($product->getElementsByTagName('name') as $name )
{
$append[] = $name;
}
foreach ($append as $a)
{
$nodeName = __cleanData($a->textContent);
$element = $xml->createElement(htmlentities($nodeName) , 'a');
}
$product->removeChild($xml->getElementsByTagName('details')->item(0));
$product->appendChild($element);
}
$result = $xml->saveXML();
$file = "data.xml";
file_put_contents($file,$result);
原始XML如下所示:
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="/v1/xsl/xml_pretty_printer.xsl" type="text/xsl"?>
<products>
<product>
<modelNumber>M100</modelNumber>
<itemId>1553725</itemId>
<details>
<detail>
<name>1 Ohm Stable</name>
<value>600 x 1</value>
</detail>
</details>
</product>
</products>
新文档应该是这样的:
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="/v1/xsl/xml_pretty_printer.xsl" type="text/xsl"?>
<products>
<product>
<modelNumber>M100</modelNumber>
<itemId>1553725</itemId>
<1 Ohm Stable>
</1 Ohm Stable>
</product>
</products>
发布于 2011-12-15 17:52:02
简单地说,您不能使用以数字开头的元素名称
1OhmStable <-- rename this
_1OhmStable <-- this is fine
php parse xml - error: StartTag: invalid element name
一篇很好的文章:- http://www.xml.com/pub/a/2001/07/25/namingparts.html
名称是以字母或几个标点符号之一开头,并以字母、数字、连字符、下划线、冒号或句号开头的标记,这些字符一起称为名称字符。
发布于 2011-12-15 17:47:18
即使__cleandata()
将删除除拉丁字母a-z和数字之外的所有其他字符,也不一定保证结果是有效的XML名。您的函数可以返回以数字开头的字符串,但数字在XML中是非法的name start字符,它们只能出现在名称中的第一个名称字符之后。此外,名称中禁止使用空格,因此这是预期的XML输出失败的另一个原因。
发布于 2011-12-15 17:36:19
确保脚本具有相同的编码:如果是UTF,请确保它们在文件的开头没有字节顺序标记(BOM)。为此,请使用Notepad++之类的文本编辑器打开XML文件,然后将文件转换为"UTF-8格式,不带BOM“。
我也有过类似的错误,但使用的是json file
https://stackoverflow.com/questions/8524111
复制相似问题