腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
带有
动态
更改
网站
的
下拉菜单
的
Web
抓取
网站
(
onchange
)
、
、
、
、
因此,我试图从一个
网站
上
抓取
人口普查数据,当从
下拉菜单
中选择一个县时,该
网站
会
动态
变化。它看起来是这样
的
: <select id="cat_id_select_GEO"
onchange
="changeHeaderSelection('GEO'); <option value="0500000US01001一旦我选择了县,我知道如何获得我想要
的
数据。但我从来没有刮过
网站</
浏览 11
提问于2019-05-23
得票数 1
1
回答
Googlesheet中
的
importxml函数
、
首先,我完全不称职,我长达数小时
的
尝试都是徒劳
的
。所以,求求你,有个人可以帮我。 我有过 table id="..........." tablesorter class="........"它们在相同
的
代码行中,我可以
抓取
到第一个元素。对我来说,勉强通过第二个是很重要
的
。我尝试了不同
的
方式,但一无所获 investing 在图像中,在左侧突出显示
的
部分有
下拉菜单
,可以选择不同
的
美国市场(纳斯达
浏览 57
提问于2020-12-05
得票数 0
1
回答
美汤
网站
-
带有
下拉菜单
的
抓取
网站
、
、
、
、
我试图刮一个
网站
,其中有一个
下拉菜单
,用户可以选择数据显示
的
年份。然而,我似乎被困在了我
的
实现中。这是
网站
网址:https://www.pgatour.com/tournaments/masters-tournament/past-results.html 这是一个个人项目,每年收集每个主要锦标赛
的
高尔夫数据一旦选择了年份,我知道如何提取所需
的
统计数据。以下是
下拉菜单
的
网站</
浏览 19
提问于2019-04-17
得票数 3
1
回答
在Android上
抓取
动态
生成
的
页面。
、
、
、
、
我目前正在进行一个项目,该项目通过搜索查询(即谷类食品)来
抓取
杂货店页面上
的
数据,并将其显示在旋转视图中。但是,我很难找到一种从页面中
抓取
数据
的
方法。我试着使用Jsoup,因为这是在线
的
concensus,但这不支持JavaScript。 问题在于,如果不是全部的话,大多数这样
的
网站
都使用DOM存储来更新股票列表和价格。这就是为什么像JavaScript这样
的
库不能工作,因为它们不会为任何返回HTML。我目前有一个通过WebView显示页面的原型,但是
浏览 1
提问于2021-11-19
得票数 0
回答已采纳
1
回答
动态
实时
网站
的
Web
抓取
、
、
、
、
我几乎没有尝试从这个页面中刮取以下数据:我试图创建一个列表,这样我就可以将它们作为数据类型来处理,并进行一些计算。有人告诉我bs4不读
动态
网站
,所以我转而使用selenium,编写了如下代码:from selenium.webdriver.common.by[] job_list.append(job.get_attribute('href'))因
浏览 5
提问于2022-10-19
得票数 0
回答已采纳
1
回答
使用python从
下拉菜单
中
抓取
所有
动态
生成
的
数据
的
最佳方法
、
、
、
我正在创建webscraper,它将从这个
网站
中
动态
地生成玩家数据。 我想要创建一个循环,它将从
下拉菜单
中为播放器生成数据,刮取数据,然后循环遍历
下拉菜单
中
的
所有播放器列表。我很好奇是否使用selenium与站点交互是最好
的
方法。但我也注意到,每个播放器
的
URL都遵循特定
的
模式,所以我考虑了
抓取
初始页面来收集我需要
的
所有数据,然后使用这些数据构造URL列表,然后循环遍历URL列表并将它们作为静态页面处理。是否有为这
浏览 6
提问于2020-03-18
得票数 1
回答已采纳
1
回答
如何使用scrapy或selenium
抓取
动态
页面?
、
、
、
、
我正在尝试
抓取
web
动态
页面,但使用scrapy时,我不能检索所有信息,因为我想要
的
信息是
动态
的
。 我试着使用Selenium,但与Scrapy不同
的
是,你不能指定头部,
网站
阻止了我。(我不能说出这个
网站
的
名字,因为
抓取
是非法
的
,但它是一个著名
的
旅游元搜索引擎...)。我有一个
带有
验证码解算器
的
页面(用脚本很难解决重新验证码),
浏览 23
提问于2019-06-13
得票数 0
5
回答
如何从其他
网站
获取数据?
、
、
、
我想创建一个
网站
,从其他
网站
提取信息,并将它们打印到我
的
网站
上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?
浏览 1
提问于2013-06-14
得票数 4
1
回答
当试图收集产品价格信息时,rvest
web
scraping返回一个空
的
数据帧。
、
、
、
、
class, 'h5 js-price v-spacing-mini art-pl-price')]") %>% data.frame() 然而-这是返回一个空
的
数据帧
浏览 7
提问于2020-06-18
得票数 2
回答已采纳
1
回答
从数据小部件中获取数据,并没有检索任何值。
、
、
我正在尝试使用rvest获取数据(也尝试使用XML和selectr),但遇到以下问题时遇到了困难:<span data-widget="turboBinary_tradologic1我想获取1226.45,但是当我运行我
的
代码(下面)时,它说那里没有存储
的
信息。这与它是一个小部件
的
事实有关吗?如能就如何开展工作提出任何建议,将不胜感激。
浏览 9
提问于2017-02-15
得票数 0
回答已采纳
2
回答
如何在
带有
R
的
网站
的
搜索框中直接书写
、
、
我正在寻找一种方法来做网页
抓取
后,在其搜索框中键入。让我用一个例子更好地解释:我正在寻找一个R函数,它直接在amazon主页上写入单词"notebook“,这样我就可以随后对生成
的
页面进行
web
抓取
。感谢大家
的
帮助。
浏览 2
提问于2021-01-25
得票数 1
1
回答
如何从
web
归档文件下载
网站
、
、
、
、
我几乎花了一个月
的
时间试图弄清楚如何从
web
.archive.org
的
web
存档中下载
网站
sudo wget --limit-rate=200k --no-clobber --convert-links--random-wait -r -p -E -e robots=off -U mozilla http://
web
.archive.org/
web
/20031208182936/http://www
浏览 0
提问于2017-01-25
得票数 1
2
回答
是否需要为每个目标站点编写
抓取
器?
、
、
、
、
我是个刮东西
的
新手。我写了一个 刮板 它将擦伤 Maplin 商店。我使用Python语言和BeautifulSoup来
抓取
存储。我想问
的
是,如果我需要清理一些其他
的
eCommerce商店(比如亚马逊、Flipkart),我是否需要定制我
的
代码,因为它们具有不同
的
HTML ( 和 名字是不同
的
,另外还有其他东西)。所以,我写
的
刮板不适用于其他eCommerce商店。 我想知道比价
网站
是如何从所有在线商店中
抓取
数据<e
浏览 40
提问于2014-12-28
得票数 7
回答已采纳
3
回答
如何使用Beautiful从python代码中获得javascript函数
的
结果?
、
、
、
、
我想从一个使用Python中
的
“美丽汤”
的
网站
上
抓取
数据。
网站
根据用户
的
选择
更改
下拉菜单
的
值。在
更改
下拉菜单
的
值时没有api调用。仔细看一下,我注意到有一个javascript函数在内部调用,以获取
下拉菜单
的
值。我
的
问题是
下拉菜单
的
值不在页面源中。它们是通过调用js函数获得
的
浏览 7
提问于2014-04-06
得票数 1
回答已采纳
1
回答
如何在Firefox::Mechanize中触发
onchange
事件?
、
、
、
、
我正在使用Firefox::Mechanize来
抓取
一个
网站
。我被一个
下拉菜单
卡住了,这个
下拉菜单
有一个
onchange
事件与之关联。我可以从
下拉菜单
中选择我想要
的
选项,并且我能够验证这一点,因为
下拉菜单
现在显示了我选择
的
选项。但它不会触发与之关联
的
onchange
事件。我在想,在选择我
的
选项后,我可能需要一个"click“事件,但我不确定如何准确地合并它。下面是HTML
浏览 3
提问于2015-10-28
得票数 0
2
回答
搜索结果第二页
的
request.get url
、
、
、
、
我正在尝试使用request.get( url )从服务器获取url
的
响应。以下代码适用于搜索结果第一页
的
url:soup = BeautifulSoup(r.text)r = requests.get("https:/
浏览 0
提问于2018-05-30
得票数 0
1
回答
有没有办法使用机器人加载/访问完整
的
网页(所有子页面)?
、
、
我
的
问题是,我在这个
网站
上有数千个页面,我不能一个接一个地访问它们,因为这会花费很多时间。有没有网络爬虫或类似的东西来做这个任务?只是为了访问页面,因为访问页面会生成缓存文件,然后它
的
工作速度会更快。
浏览 14
提问于2017-03-03
得票数 0
1
回答
为什么我
的
Crawler会得到错误
的
HTML代码?
、
实际上,用jsoup库实现
的
爬虫代码可以工作,因为我
的
请求
的
结果是一些HTML代码,但是当我搜索一个明确写在
网站
上
的
单词时,没有找到它,因为一些div
的
来自于空
的
爬虫。然后我意识到,当您导航到
网站
并右键单击‘查看页面源’时,我得到了与相同
的
代码。当我将代码与进行比较时,右键单击“->”检查“”时,代码与“查看页面源”中
的
不同。我能做些什么来获得包含全部内容
的
HTML代码吗? 请求网址:
浏览 0
提问于2019-09-12
得票数 1
回答已采纳
3
回答
抓取
网站
的
请求/第二标准是什么?
这是与我
的
问题最接近
的
问题,但它并没有得到很好
的
回答: 你每秒应该做多少个请求来
抓取
?对此有什么标准吗?当然,所有的大型搜索引擎在这方面都有一些他们所遵循
的
准则。
浏览 0
提问于2010-05-30
得票数 10
1
回答
下面的JavaScript代码与Facebook相关
这看起来像一个异步函数,它是这个异步函数是做什么
的
?为什么它被称为“刮板”?
浏览 0
提问于2012-09-08
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
网站抓取引子-获得网页中的表格
福州网站建设公司说的动态网站和静态网站建设的区别
静态网站与动态网站的优缺点有哪些?
网站收录骤停?是抓取异常导致的!
网站抓取异常的原因及解决方法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券