假设一个简单的html dom对象包括以下内容:
text1
<br />
<br />
<br />
text2
<br />
如何使用简单的html dom获取这两个文本中的任何一个?
发布于 2012-05-27 01:49:28
要获取所有纯文本元素,可以使用以下命令:
$string="text1
<br />
<br />
<br />
text2
<br />";
$html = str_get_html($string);
$texts=$html->find('text');
foreach($texts as $elem_index => $text){
echo $elem_index."=>".$text."<br>";
}
您的输出应如下所示:
0=>text1
1=>
2=>
3=> text2
在foreach循环中,您显然可以执行所需的任何过滤操作。例如,如果您试图查找一些与特定字符串匹配的文本,您可以简单地这样做:
if (trim($text) == "text2")
//do something
因此,如果想要替换找到的文本,可以使用:
if (trim($text) == "text2")
$texts[$elem_index]->innertext = "something else";
$html->save();
而$html
将包含新的html。
发布于 2017-11-30 06:06:41
只需使用纯文本从html获取文本值。
$opts = array(
'http' => array(
'method' => "GET",
'header' => "Accept-language: en\r\n" .
"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US;
rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6\r\n" .
"Cookie: foo=bar\r\n"
)
);
$context = stream_context_create($opts);
$html1 = new simple_html_dom();
$html1->load_file($url, false, $context);
$appName1 = $html1->find('tagname.classname or id', 0)->plaintext;
对于类使用(tagname.classname
),对于id使用(tagname#id
)获取文本。
$context用于设置浏览器支持的头部,如果任何网站获得移动版,那么你可以添加头部来获取浏览器支持内容。
发布于 2012-04-13 20:06:18
使用jquery尝试$(document.body).contents();
这应该是一个以text1和text2作为文本节点的节点数组。
https://stackoverflow.com/questions/10146631
复制