我试图使用创建一个vb6刮板,我的技术是使用get 2文本函数搜索html页面。
该功能被测试并正确地工作在所有的站点上,除了一个新的站点,我试图使用同样的技术,但是失败了。
问题是html没有显示数据,html的一部分如下所示:
<tr>
<td valign="top" nowrap="nowrap" class="label">Company Name:</td>
<td><span class="search-custom" id="synopsisDetailsOppNum"></span></td>
</tr>值应该出现在上面的span标记之间,但它不像上面的代码那样出现在HTML中。
该网站正在使用javascript来管理数据。
我也尝试过使用等待函数,可以用HTML显示数据,但也失败了。
是否有任何解决方案来获得值,即使使用vb.net,因为我可以更新我的代码
发布于 2014-01-05 23:08:17
该网站正在使用JavaScript将数据添加到网页中,这样的操作不会出现在页面源上。
The follwoing被引用自大卫索耶McFarland的“JavaScript & jQuery:失踪手册”
使用JavaScript通过添加、更改、删除和重新排列HTML代码来操作DOM的一个问题是,当JavaScript完成时,很难弄清楚页面的HTML是什么样子的。例如,每个浏览器中可用的View Source命令仅显示从web服务器下载的网页文件。换句话说,在JavaScript更改HTML之前,您会看到它,这会使您很难确定您正在编写的JavaScript是否真正产生了您所追求的HTML。例如,如果在JavaScript向表单页添加了10条错误消息之后,或者在JavaScript程序创建了一个包含文本和表单字段的详细弹出对话框之后,您可以看到页面的HTML是什么样子的,那么如果您最终得到了所需的HTML,就会更容易看到。幸运的是,大多数主流浏览器提供了一组开发工具,可以让您查看呈现的HTML --浏览器在JavaScript完成其神奇功能之后显示的HTML。通常,这些工具以窗格形式出现在浏览器窗口的底部,在网页下面。不同的选项卡允许您访问JavaScript代码、HTML、CSS和其他有用的资源。打开工具面板的选项卡和方法的确切名称因浏览器而异:·在Firefox中,安装Firebug插件(在第477页中讨论过)。使用您希望看到的JavaScript代码打开一个页面,并打开Firebug (Tools→Firebug→Open )。单击Firebug面板中的HTML选项卡,您将看到完整的DOM (包括由JavaScript生成的任何HTML )。或者,您可以使用Firefox中的Web工具栏查看常规HTML源和生成的HTML。·在IE9中,按F12键打开Developer面板,然后单击HTML查看页面的HTML。在IE9的例子中,HTML首先显示下载的HTML (与View命令相同)。但是,如果单击刷新图标(或按F5),HTML选项卡将显示已呈现的HTML,并完成任何JavaScript创建的更改。·在Chrome中,选择View→Developer→Developer Tools,然后单击浏览器窗口底部面板中的Elements选项卡。·在Safari中,确保打开开发人员菜单(选择Safari→首选项,单击高级按钮,并确保选中“菜单栏中的显示开发菜单”。然后打开您感兴趣的页面,并选择检查器。单击显示在浏览器窗口底部的面板中的“元素”选项卡。·在歌剧中,选择→高级→歌剧蜻蜓工具。(蜻蜓是Opera内置开发工具的名称。)在浏览器窗口底部出现的面板中,单击“文档”选项卡。
因此,刮取器不会在JavaScript完成后下载该页面,它将在任何JavaScript操作之前得到它所看到的
你可以看到Michael谈论屏幕刮刀技巧:从困难的网站中提取数据。
http://www.youtube.com/watch?v=NtffxCi8aq4
https://stackoverflow.com/questions/20926783
复制相似问题