有没有办法把网页上的文本写到文本文档上呢?(.txt)我今天开始用Jsoup来尝试这样做,但它似乎并不完全是我想要的(或者我想是这样)。所以,如果有任何方法可以用Jsoup或其他任何东西来实现,请让我知道。谢谢。
发布于 2015-09-10 01:47:51
JSoup允许您以string的形式访问响应的正文,因此您可以执行response.body(),并使用普通的PrintWriter或您喜欢的任何方式编写该响应。
JSoup主要用于从站点中提取实体,因此如果这是您需要做的全部工作,那么也许您可以使用一个更简单的库-通常,将抓取与解析分开以实现并行化是很有用的。Apache是一个用于执行HttpClient请求的非常流行的库,根据这个example,您只需将响应实体作为字符串并写入即可
您是否需要协商SSL连接或传递任何cookie?如果是这样的话,HttpClient提供了很多不错的features
Jetty HttpClient是另一种选择,或者您甚至可以使用curl url > filename。
发布于 2015-09-10 01:58:02
https://stackoverflow.com/questions/32491654
复制相似问题