使用jsoup删除标签,但保留给定的标签,可以通过以下步骤实现:
parse()
方法将HTML字符串解析为一个Document对象。例如:String html = "<html><body><div><p>要删除的标签</p><p>要保留的标签</p></div></body></html>";
Document doc = Jsoup.parse(html);select()
方法选择要删除的标签,并使用remove()
方法将其从Document对象中删除。例如,如果要删除所有的<p>
标签,可以使用以下代码:Elements elements = doc.select("p");
elements.remove();select()
方法选择要保留的标签,并使用unwrap()
方法将其从其父标签中解封。例如,如果要保留所有的<div>
标签,可以使用以下代码:Elements elements = doc.select("div");
elements.unwrap();html()
方法获取处理后的HTML字符串。例如:String processedHtml = doc.html();完整的示例代码如下:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class JsoupExample {
public static void main(String[] args) {
String html = "<html><body><div><p>要删除的标签</p><p>要保留的标签</p></div></body></html>";
Document doc = Jsoup.parse(html);
// 删除指定的标签
Elements elementsToDelete = doc.select("p");
elementsToDelete.remove();
// 保留给定的标签
Elements elementsToKeep = doc.select("div");
elementsToKeep.unwrap();
String processedHtml = doc.html();
System.out.println(processedHtml);
}
}
这样,你就可以使用jsoup删除标签,但保留给定的标签了。请注意,这只是一个示例,具体的标签选择器和操作方式可以根据实际需求进行调整。
领取专属 10元无门槛券
手把手带您无忧上云