腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
网页
中
提取
内容并使用
Java
进行比较
、
我正在开发一个
Java
项目,其中我有一个子模块,我需要从
网页
提取
内容
文本
,图像,颜色,并将其与另一个
网页
进行比较。我计划在本地使用WinHTTrack软件下载
网页
,但问题是它没有保存为超
文本
标记语言。如何使用WinHTTrack等软件下载具有超
文本
标记语言扩展名的
网页
,或仅通过ctrl+s保存
网页
。此外,我计划使用HTML解析器来
提取
3种内容类型
文本
,图像,颜色,下载后的
网
浏览 2
提问于2012-03-06
得票数 0
回答已采纳
2
回答
与selenium api通信的jquery事件处理程序
、
、
、
我有一个
java
selenium应用程序,它需要知道某些事件。这意味着
java
应用程序等待在打开的浏览器窗口中进行的用户输入。例如,如果我想在用户每次点击某个元素时向
java
应用程序发送一条消息,这样我就可以用该信息做一些事情,我该如何实现呢?
浏览 2
提问于2011-09-16
得票数 0
回答已采纳
1
回答
如何从Selenium中的xpath表达式获取
文本
元素?
、
当Selenium浏览
网页
时,我想保存该
网页
中的一些
文本
。我在
Java
中使用Selenium。那么有没有办法从web页面中
提取
具有特定xpath
文本
呢?
浏览 1
提问于2011-08-30
得票数 0
3
回答
如何从网站/博客中
提取
文章内容
、
、
、
我正在尝试编写一个通用函数,用于从博客文章和网站中
提取
文章
文本
。随机网站: ...
浏览 6
提问于2015-04-26
得票数 3
回答已采纳
9
回答
如何从HTML页面中仅
提取
主要
文本
内容?
、
、
、
更新我从随机站点下载了一些页面,现在我想分析页面的
文本
内容。问题是,一个
网页
有很多内容,比如菜单、宣传、横幅等。 我想尝试排除所有与页面内容
浏览 96
提问于2011-08-11
得票数 22
回答已采纳
2
回答
java
中的正则表达式
如何使用
java
使用正则表达式来
提取
网页
中的链接(假设我将html页面作为
文本
文件)?
浏览 0
提问于2010-08-19
得票数 1
1
回答
使用内联CSS
提取
HTML文章
文本
、
、
我想从爬行的html
网页
中
提取
文本
。我正在使用优秀的开源库来实现这一点。但是,使用BoilerPipe时,我只能得到原始
文本
。除了原始
文本
,我需要捕获所有css样式信息内联的原始源格式信息的
文本
。有没有办法使用Boilerpipe或任何其他
java
库,最好是开源的?
浏览 3
提问于2012-06-10
得票数 1
回答已采纳
3
回答
如何在
java
中
提取
网页
文本
内容?
我正在寻找一种方法,以
提取
从
网页
(最初的html)使用jdk或其他库的
文本
。请帮帮忙 谢谢
浏览 1
提问于2010-06-14
得票数 6
回答已采纳
3
回答
从
网页
源代码中
提取
明文(从网站获取大量歌词)
、
、
O社区,我正在为一个应用程序编写伪代码,该应用程序通过读取页面的源代码从远程主机(web服务器,而不是我自己的主机)中
提取
歌词。这是假定: 你有什么意见建议?重定向到
浏览 4
提问于2012-06-07
得票数 2
回答已采纳
2
回答
使用python中的美观汤从具有更多
文本
内容的Web页面中
提取
数据
、
、
、
、
我一直在尝试
提取
网页
中数据丰富的节点。有没有办法从
网页
中
提取
文本
?http://www.amazon.in"html = BeautifulSoup(r.content)我可以打印
网页
的标题,你能帮我
提取
网页
中的
文本
(只有
文本
)吗?
浏览 7
提问于2015-04-22
得票数 1
回答已采纳
2
回答
使用htmlagilitypack
提取
文本
和图像
、
、
、
我正在从
网页
中
提取
内容。在
网页
中,电话号码和电子邮件id等信息都存储在图像中。我想要
提取
图像和表格中的
文本
。在输出字符串中,我希望输出的方式与在带有图像和
文本
的
网页
中显示的方式相同。以下是
网页
内容。<td><img src="" /></td><tr> &l
浏览 2
提问于2012-07-20
得票数 0
1
回答
如何在输入的
文本
区域
文本
的段落之间添加行?
、
我正在创建一个小的
网页
,作为一个提词器。用户到达页面,将
文本
复制并粘贴到
文本
区域,然后以提词器的形式显示
文本
。
文本
很可能是从Google或office复制的。我的问题是,当我使用
java
脚本将
文本
从
文本
区域
提取
到<p>标记时,如何在段落之间添加空行(比如按下Enter键)? 提前感谢!
浏览 2
提问于2015-04-14
得票数 0
回答已采纳
2
回答
是否有一个著名的分类器库?
我从互联网上抓取数据,没有分类。编辑
浏览 1
提问于2009-10-29
得票数 0
1
回答
有没有办法将Internet explorer窗口中的内容复制到Jframe应用程序窗口?
、
、
我正在为一个自动化项目创建一个使用
Java
和Jframe的小型可执行应用程序。我只想通过单击Jframe应用程序中的一个按钮来复制网站(在Internet Explorer中打开)中的特定内容。
浏览 1
提问于2016-10-26
得票数 0
1
回答
Tika信息抽取
、
我可以知道如何使用Tika在
网页
中
提取
表格形式的信息,如数字吗?为此,Tika有解析器吗? 谢谢
浏览 0
提问于2012-08-16
得票数 1
3
回答
从
网页
中
提取
文本
(例如文章)的最佳方法
、
、
我遇到麻烦的一步是从
网页
中
提取
文章。我还找到了这个产品:,我想知道你是否认为这是可行的方法?如果是这样的话,有没有人能给我指个
java
实现--虽然很明显它确实存在,但似乎找不到。澄清-我更多的是寻找一种算法/库/方法,用于检测html dom树中可能是一篇文章的
文本
块位于何处。ps如果你认为这在python这样的东西中要容易得多,就说-尽管
浏览 1
提问于2013-12-25
得票数 8
3
回答
“汤”和“美汤”中的“汤”是什么意思?
、
“汤”和“美汤”中的“汤”是什么意思,为什么它被称为“汤”?
浏览 1
提问于2014-05-19
得票数 10
1
回答
Slideshare.net站点在iPad Safari中是如何工作的?
、
我现在正在探索在移动浏览器中打开Office文档,但确保用户没有访问该文件的权限。示例:查看以下内容:还有一件事是,当我在iPad和安卓上测试时,有时我会得到一个pps演示文稿,里面充满了图片(只有保存的选项),有时我可以选择复制、粘贴到其中的普通幻灯片。
浏览 0
提问于2011-09-26
得票数 0
1
回答
如何从webelement获取Xpath位置
、
、
我希望能够在
网页
中搜索某个
文本
值,然后将此位置存储为xpath,这样我就可以重新访问此
网页
,以查看此
文本
值是否已更改。我的想法是使用selenium webelement,我将在页面上的所有元素中搜索
文本
值。然后,一旦我有了它,我想
提取
这个元素的位置。然后,我可以使用之前存储的位置重新访问此页面,以检查最新的
文本
值。我在想像这样的东西...
java
.util.List<WebElement> els = driver.findElemen
浏览 1
提问于2016-02-16
得票数 0
1
回答
解析html页面并将内容(标题、
文本
等)存储到数据库中
、
、
有没有人知道一些开源工具来解析html页面,过滤广告,JS等,以获得标题,
文本
。我的应用程序前端是基于LAMP的。所以我需要解析html页面并将它们存储到Mysql中。并用这些数据填充首页。
浏览 3
提问于2010-09-17
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本提取函数
文本提取仨兄弟
Python提取网页图片
Excel中批量提取摘要文本
波波带你手动提取网页视频
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券