腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Selenium
和
VBA
从
PDF
中
抓取
特定
文本
、
、
、
我正在做一个自动化项目,它从打开浏览器,访问URL,登录到它,点击几个链接,最后点击一个在浏览器本身打开
PDF
文件的链接开始。现在,我想从
PDF
到Excel
中
获取一行(如字符串)。我
使用
了下面的代码,这是由GitHub的作者提供的。
使用
代码,我只能
抓取
PDF
的第一行。我
使用
的
PDF
是动态的,有时我需要的信息在第5行,有时在第25行,以此类推…… 希望我已经解释过了,请原谅我的错误。Private Sub Handle_
PDF<
浏览 31
提问于2019-06-18
得票数 0
回答已采纳
1
回答
如何
在rails
中
仅从
pdf
文件中提取高亮数据
、
我想在rails
中
删除
pdf
中所有突出显示的
文本
。有没有人知道我搞不懂它。
浏览 1
提问于2020-07-07
得票数 0
1
回答
如何
以编程方式比较
pdf
文件的布局?
、
、
、
可以
从
pdf
中
抓取
文本
并对其进行比较。这里我需要比较一下
pdf
和
另一个
pdf
文件的布局。这在编程上是可能的吗?有第三方工具可以做到这一点,但它是否可用于
使用
selenium
或任何编程语言进行测试?
浏览 1
提问于2016-05-20
得票数 1
1
回答
Word
VBA
:解析联机
PDF
并通过用户表单显示在Word
中
、
、
有没有办法让我能够
抓取
一个
PDF
,并以某种方式解析它,并通过Word
中
的表单通过UserForm显示它?例如,我有一个表单,我可以将链接放到像www.website.com/file.
pdf
这样的在线
PDF
,然后UserForm解析该
PDF
,并在列表框
中
显示为纯
文本
。我不需要它的代码,只需要知道这是否可能,如果是的话,一些关于我
如何
去做的提示将是很好的。 我知道可能性很小,但这是不可能的。但如果你们能帮我解决这个问题,那就太
浏览 2
提问于2011-03-11
得票数 1
回答已采纳
2
回答
使用
Selenium
和
Python
从
HTML
中
的表中提取数据
、
、
我的任务是在HTML
中
从
表的每一行中提取一些项。我已经知道了
如何
使用
Python
使用
Selenium
从
web上获取整个表。以下是这方面的守则:import time print(row.text) 我无法理解
如何
从
表
浏览 0
提问于2018-06-18
得票数 0
1
回答
如何
抓取
HTML5网站并将其内容转换为
PDF
(
使用
Python或Ruby库)?
、
、
、
、
我正在寻找一个可以登录网站,
抓取
HTML5内容(主要是画布上的图表),并能够将其转换为engine/solution/framework/gem/egg/lib/whatever文件(或图像)的Ruby我可以用mechanize编写爬行脚本,这样我就可以登录网站并
抓取
数据,但是mechanize不理解复杂的JavaScript + HTML5。
浏览 2
提问于2012-08-24
得票数 3
回答已采纳
1
回答
VBA
Selenium
从
标签
中
抓取
文本
、
、
、
、
如何
使用
Selenium
中用于
VBA
的铬驱动程序提取以下“标签”?
浏览 6
提问于2022-07-22
得票数 1
回答已采纳
3
回答
如何
创建一个快照或克隆的PHP,MySQL页面...所需的灵感
、
、
、
、
当返回这些保存的数据时,我们需要能够看到为该
特定
计算提交的所有信息,因此,如果该数据发生了更改,我们将看到与该计算相关的内容。现在我们已经想过,当计算完成时,可能会有一个快照,网页的
pdf
或类似的东西可以做,但这是简单的做吗? 我希望这是有意义的。
浏览 1
提问于2009-11-27
得票数 1
1
回答
我想用for循环逐个打印显示在文件夹
中
的图像
文本
。
、
一个接一个地
从
folder.this
中
抓取
图像
文本
,只有一个image.how可以对所有图像进行扫描。filepath); instance.setDatapath("C:\\
selenium
_work\\ScrapingText.
PDF
\\tessdata"); String result =
浏览 0
提问于2019-06-05
得票数 0
回答已采纳
1
回答
PDF
Google文档查看器
、
、
我
使用
谷歌文档在我的网站上显示嵌入的
PDF
。它像这样
使用
iframe: <iframe src="http://docs.google.com/viewer?url=http%3A%2F%2Fwww.emathhelp.net%2Fpdf%2F1%2F1331155133.
pdf
&embedded=true" width="800" height="500"style="border: none;"&
浏览 1
提问于2012-04-28
得票数 0
回答已采纳
1
回答
创建动态解析器,
从
启用javascript的网页
中
收集数据
、
、
我用
VBA
和
selenium
一起编写了一个刮刀器,
从
启用javascript的网页
中
解析产品名称
和
价格。问题是,我只是
使用
selenium
获取页面源(因为不可能在不
使用
selenium
打开页面的情况下获得响应
文本
),并且一旦得到它,我就返回到通常的
VBA
方法来完成操作。最重要的是,很难处理解析价格的问题,因为价格有两种类型的类名,因此如果脚本中
使用
了
特定<
浏览 0
提问于2017-08-26
得票数 1
回答已采纳
1
回答
在Visualforce页面上呈现Salesforce文档对象实例正文
、
、
、
我在Salesforce的文档
中
存储了一个
PDF
文件。我需要从Document对象
中
获取文档,并将其呈现为
PDF
visualforce页面。当我获得文档的正文时,它是一个斑点的形式。目前,当我在一个顶点:outputText中
使用
它时,它只是呈现为"core.filemanager.FileBlobValue@4fle23d3“。提前谢谢。
浏览 1
提问于2013-05-08
得票数 2
1
回答
selenium
从
网站中将内容
抓取
到数组
中
、
、
、
我对
从
网站上
抓取
内容并将其放入数组感兴趣。具体来说,我感兴趣的是通过识别纯
文本
所在的html元素,将纯
文本
抓取
到数组
中
。我正在与Java一起
使用
selenium
,我希望有人能够了解一下实现这一目标的最佳方法。我将扫描多个纯
文本
元素,并将它们按顺序排列到一个数组
中
。纯
文本
将在html表
中
,我需要获取表
中
具有我感兴趣的纯
文本
的
特定
部
浏览 0
提问于2015-05-11
得票数 0
回答已采纳
1
回答
如何
在UIPath
中
实现
文本
和数据的
抓取
和
插入到excel
中
、
有没有人知道
如何
使用
get
文本
和数据,把它们拼凑起来并插入到Excel
中
? 我想在我的Excel
中
显示的是那些在蓝色高亮显示,我能够得到数据表
使用
数据
抓取
,但我不能得到“104445”在一起。
浏览 5
提问于2020-09-01
得票数 2
1
回答
C#下载包含正确显示所需内容的网站
、
由于多种原因,我们想要显示索引,以便我们可以把它放在我们的投资组合
中
。第一个想法是对每个网站进行程序截图。我们公司的负责人立即揭穿了它,因为他们想要现场直播。Iframes显然不是一种选择。可能只有正确显示它所需的样式
和
图像。你们有什么想法吗?
浏览 3
提问于2016-03-30
得票数 0
1
回答
使用
关键字
从
pdf
中提取页面
、
、
、
我写这些宏的工作,其中之一需要能够选择一个基于关键字的
pdf
。然后进入
pdf
,
使用
一组不同的关键字搜索页面的标题或页面本身的
文本
。当它找到与第二个集合
中
的关键字之一匹配的页面时,它会将整个页面按原样提取到单个页面
pdf
中
。这只是宏目的一小部分。
浏览 4
提问于2014-06-09
得票数 0
3
回答
使用
Selenium
Webdriver PHP选择元素?
、
、
我希望
使用
Selenium
Webdriver PHP将许多页面元素存储在一个变量
和
循环中。例如:< cite > Name 2 < /cite >我
使用
了下面的代码,但是它没有给我上面的结果我
如何
使用
Selenium
Webdriver
从
元素<em
浏览 0
提问于2013-10-22
得票数 1
2
回答
Python -
如何
在URL
中
不分页地刮分页
、
如何
使用
URL访问下一页,内容如下:我知道
如何
使用
刮取库(BS4、
Selenium
),但我不知道
如何
抓取
这样的站点。我一直在玩谷歌Chrome开发工具,但没有成功。像Python这样的
抓取
站点通常的工作流程是什么?
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
3
回答
获取页面的可视
文本
、
如何
使用
selenium
webdriver在没有HTML标记的情况下获得web页面的可视
文本
部分? 我需要一个等同于Htmlunit
中
的函数HtmlPage.asText()的东西。
使用
函数WebDriver.getSource获取
文本
并
使用
jsoup解析它是不够的,因为页面
中
可能存在我不感兴趣的隐藏元素(通过外部CSS)。
浏览 1
提问于2013-08-20
得票数 42
回答已采纳
1
回答
具有身份验证的在线
pdf
内容到BufferedInputStream
、
、
、
我一直试图阅读在浏览器
中
打开的
pdf
的内容,但没有成功。位置-打开一个新的标签-然后我切换到标签
和
抓取
网址。一个重要的细节-这是一个嵌入的
pdf
。 有什么解决办法--比如
抓取
已经加载的
pdf
--而不是打一个新电话?我没有主意了。谢谢!请注意,我也在
Selenium
使用
的Chrome配置文件上打开了设置,但是当
Selenium
浏览器打开时,此设置将被关闭。做点什么,也就是:获取
文本
。
浏览 1
提问于2019-08-22
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用DNS和SQLi从数据库中获取数据样本
科技行业中如何使用错别字识别工具提高文本处理效率和质量?
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
使用多个Python库开发网页爬虫(二)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券