在Java中,可以使用多种方式来获取页面的HTML内容。以下是一种常见的方法:
示例代码:
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
public class HtmlFetcher {
public static String fetchHtml(String url) throws IOException {
HttpURLConnection connection = null;
BufferedReader reader = null;
StringBuilder htmlContent = new StringBuilder();
try {
URL urlObj = new URL(url);
connection = (HttpURLConnection) urlObj.openConnection();
connection.setRequestMethod("GET");
reader = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String line;
while ((line = reader.readLine()) != null) {
htmlContent.append(line);
}
} finally {
if (reader != null) {
reader.close();
}
if (connection != null) {
connection.disconnect();
}
}
return htmlContent.toString();
}
public static void main(String[] args) {
try {
String html = fetchHtml("https://www.example.com");
System.out.println(html);
} catch (IOException e) {
e.printStackTrace();
}
}
}
该示例代码使用HttpURLConnection发送GET请求,并通过BufferedReader逐行读取响应内容,最后将内容存储在StringBuilder中并返回。
示例代码:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import java.io.IOException;
public class HtmlFetcher {
public static String fetchHtml(String url) throws IOException {
Document document = Jsoup.connect(url).get();
Element body = document.body();
return body.html();
}
public static void main(String[] args) {
try {
String html = fetchHtml("https://www.example.com");
System.out.println(html);
} catch (IOException e) {
e.printStackTrace();
}
}
}
该示例代码使用Jsoup库的connect方法连接到指定URL,并通过get方法获取HTML文档。然后,可以使用Jsoup提供的方法来选择和处理HTML元素。
无论使用哪种方法,都可以在Java中轻松获取页面的HTML内容。
领取专属 10元无门槛券
手把手带您无忧上云