脚本宝典收集整理的这篇文章主要介绍了PHP – DOMDocument :: saveHTML创建奇怪的实体,脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
问题是,保存的html文件得到了一些它不应该有的新怪异实体.
这是一个例子.
这就是拉动的xhtml片段的样子:
<p> "At that point
这是保存的文件的样子:
<p>&Acirc; Â Â "At that point
这就是chromium看到的:
<p>Â Â Â "At that point
从被拉动的xhtml到被保存的它,它被几个不同的类处理,因此为了简单起见,我将简化数据传递的所有对象.
//curl call is inITialized here $raw = curl_exec($ch); $simplexml = simplexml_load_string($raw); $xmlstr = $simplexml->xpath($xpath)->asXML(); $html = new DOMDocument; $html->formatOutput = true; $wrapPEr = $html->createElement("div"); $wrapper->setattribute("id","wrapper"); $wrapper = $html->appendChild($wrapper); $content = DOMDocument::loadhtml($xmlstr,LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD); foreach($content->FirstChild->childNodes as $node) $wrapper->appendChild($html->importNode($node,TRUE)); $htmlstr = $html->savehtml(); $html = new DOMDocument; $html->formatOutput = true; $content = DOMDocument::loadHTML($htmlstr,LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD); foreach($content->childNodes as $node) $html->appendChild($html->importNode($node,TRUE)); $html_str = $html->saveHTML(); file_put_contents($content_path,$html_str);
是的,它有点复杂,但数据传递相当多,因为它需要添加很多东西.
我只是不明白这些新实体的来源.任何帮助,将不胜感激.
我用simplexml保存了输出,如下所示:
$xmlstr = $simplexml->xpath($xpath)->asXML();
这将输出格式化为XML,但稍后,当我将输出导入DOMDoc时,我使用importHTML执行此操作:
$content = DOMDocument::loadHTML($xmlstr,LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
我只需使用loadXML而不是loadHTML即可解决问题:
$content = DOMDocument::loadXML($xmlstr,LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
现在我的输出是正确的:
<p> "At that point
以上是脚本宝典为你收集整理的PHP – DOMDocument :: saveHTML创建奇怪的实体全部内容,希望文章能够帮你解决PHP – DOMDocument :: saveHTML创建奇怪的实体所遇到的问题。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。