腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Selenium
和
Python
来
抓取
晨星
网站
。
Selenium
没有
下载
完整
的
网页
、
、
、
、
下面是我
的
代码: from
selenium
import webdriverfrom lxml import etree url = 'https://www.morningstar.com/section/div/div/div[1]/div/div[2]/div/div/div/div[2]/ul/li[7]/div/div[2]/
浏览 7
提问于2020-01-27
得票数 1
回答已采纳
1
回答
如何
使用
Scrapy自动获取请求头?
、
我们知道,在浏览器中,可以查看->网络-> XHR -> Headers
和
get Request Header。然后可以将这些标头添加到Scrapy请求中。但是,有
没有
一种方法可以
使用
Scrapy请求自动获取这些请求头,而不是手动获取?我尝试
使用
:response.request.headers,但此信息还不够: {b'Accept': [b'text/html,application/xhtml+xml,application/xmllike
浏览 50
提问于2021-05-21
得票数 0
回答已采纳
2
回答
如何
使用
ajax元素
抓取
网页
、
、
我想
抓取
一些
网页
,如下所示 http://www.youtube.com/channel_ajax?action_load_more_feed_items=1&activity_view=1&paging=1352148528&channel_id=UCCw8aVnsIeu9S6OPQyaQ14g 我想
抓取
整个页面手动,我必须反复点击按钮,直到
没有
更多
的
加载,通过自动化,我如何<e
浏览 1
提问于2013-01-10
得票数 0
4
回答
Selenium
Webdriver
的
替代方案
、
、
我
使用
C#
和
Python
的
Selenium
Webdriver从
网站
获取数据元素,但web
抓取
的
速度非常慢。
抓取
35000个数据表花了我大约1.5天
的
时间。
使用
Selenium
Webdriver,我可以执行Javascript
来
获取Java元素。有
没有
一些库可以不需要像Webdriver这样
的
东西来在
网页
上执
浏览 5
提问于2015-04-16
得票数 13
1
回答
Selenium
下载
完整
的
html页面
、
我正在学习
使用
Python
Selenium
和
BeautifulSoup进行web
抓取
。目前,我正在尝试
抓取
谷歌搜索趋势上
的
热门搜索from bs4 imp
浏览 1
提问于2013-05-17
得票数 15
3
回答
在
Python
中
使用
java脚本
抓取
网页
、
、
、
我在windows机器上
使用
python
3.2 (newb) (虽然如果需要的话,我在虚拟机器上有ubuntu 10.04,但我更喜欢在windows机器上工作)。基本上,我可以
使用
http模块
和
urlib模块来
抓取
web页面,但只有那些
没有
java脚本document.write("<div....")
的
页面才能运行。当我获得实际
的
页面时,它会添加不存在
的
数据(意思是
没有
真正
的<
浏览 3
提问于2011-03-17
得票数 0
回答已采纳
1
回答
使用
selenium
python
脚本从服务器获取图像帧
、
、
我需要
使用
selenium
模块从网络摄像头服务器中获取图像帧。知道吗?谢谢。致以问候。
浏览 6
提问于2013-07-14
得票数 0
回答已采纳
1
回答
使用
Python
对页面
和
浏览器扩展数据进行with
抓取
、
我正在尝试获取
网页
的
文本数据,就像它在我
的
浏览器上
的
样子一样。我
的
问题是,我还
使用
了一个
网页
的
扩展,它
的
给定数据(由于它而显示
的
文本)也要被收集。我知道urllib,但它只收集正常
的
网页
数据,而不是扩展生成
的
数据。那么,如何收集这些数据有什么帮助吗?另外,我想问
的
是,这是否可能?
浏览 12
提问于2020-08-15
得票数 0
1
回答
有
没有
办法像Facebook那样在自扩展页面上
使用
BeautifulSoup?
、
、
、
当你接近底部时,一些
网页
可能会通过ajax扩展,Facebook就是一个众所周知
的
例子。我特别感兴趣
的
是截屏电影
的
电影列表页面。它确实有一个结尾,但当你向下滚动时,你可以看到它在添加电影。有
没有
办法
使用
BeautifulSoup
来
获取页面上
的
所有内容?
浏览 18
提问于2018-08-24
得票数 0
1
回答
通过
Python
/Requests登录《华尔街日报》
、
、
、
、
我从事一个学术项目,该项目需要
使用
由Requests
和
BeautifulSoup库提供支持
的
Python
脚本来
抓取
互联网上
的
各种新闻文章。最近,我
的
任务是从“华尔街日报”上
抓取
文章,并给了我一个订阅登录来
使用
。然而,在过去
的
任务中,我从来不需要在浏览实际文章之前登录
网站
。我遵循了通过请求和POST登录
的
基本逻辑,但看起来WSJ
的
登录并不遵循该协议-我仍然收到“未订
浏览 17
提问于2019-10-18
得票数 0
回答已采纳
4
回答
如何从外部
网站
获取HTML表值?
、
、
、
我想要访问一些HTML表数据,以便保存
和
脱机
使用
它们。目前,当我
下载
网页
并将JavaScript放入该文件时,我
使用
的
是JavaScript,它可以正常工作。但是我想直接从
网页
中获取元素,而不需要
下载
之前
的
内容,或者让JavaScript自动
下载
并从
下载
的
文件中获取元素。 这有可能吗?我找不到答案,因为每个人都要求自己
的
网页
,但我
没有</
浏览 32
提问于2019-02-23
得票数 0
1
回答
网站
在
抓取
时需要很长时间才能加载。
、
我不确定要给出什么标记,但是我在
python
中
使用
Selenium
,所以我决定从这里开始。我正在
使用
python
中
的
selenium
和
requests
抓取
一个
网站
数千次。它
的
启动速度相当快,但在3400页加载标记附近,它
的
速度从.1秒左右减慢到3或4秒。任何关于什么在减缓
网页
加载
的
想法。该程序正在一个非常低功耗
的
Linode (
浏览 6
提问于2022-07-08
得票数 0
1
回答
为什么我
的
Crawler会得到错误
的
HTML代码?
、
我想用java写一个爬虫
来
做一些学校练习。实际上,用jsoup库实现
的
爬虫代码可以工作,因为我
的
请求
的
结果是一些HTML代码,但是当我搜索一个明确写在
网站
上
的
单词时,
没有
找到它,因为一些div
的
来自于空
的
爬虫。然后我意识到,当您导航到
网站
并右键单击‘查看页面源’时,我得到了与相同
的
代码。当我将代码与进行比较时,右键单击“->”检查“”时,代码与“查看页面源”中
的
不同。我能做些
浏览 0
提问于2019-09-12
得票数 1
回答已采纳
4
回答
使用
Selenium
保存整个页面内容
我想知道保存
Selenium
访问站点时检索到
的
所有文件
的
最好方法是什么。换句话说,当
Selenium
访问时,我希望保存HTML、JavaScript (包括src标记中引用
的
脚本)、图像以及iframes中可能包含
的
内容。如何做到这一点?我知道getHTMLSource()将在主框架
的
主体中返回HTML内容,但是如何将其扩展为
下载
重新呈现该页面所需
的
完整
文件集。提前感谢!
浏览 0
提问于2010-06-16
得票数 13
2
回答
BeautifulSoup不会从
网页
中提取所有表单
、
、
、
、
我希望从一个给定
的
网站
使用
Python
3
和
BeautifulSoup提取所有表单。下面是一个执行此操作
的
示例,但无法提取所有表单:from bs4 import BeautifulSoup for form in forms: print('\n\n')
浏览 0
提问于2017-03-27
得票数 2
3
回答
是否有办法从
网站
的
“检查”菜单中获取有关元素
的
信息?
、
、
我试图从这个
网站
获得世界人口:,但我只能获得html代码,而不是实际数字
的
数据。import urllib.request ‘’从
网站
获取html到文本‘’ s
浏览 2
提问于2019-05-11
得票数 2
回答已采纳
1
回答
如何
使用
MatLab从这个特定
的
网站
中读取文本来分析音乐偏好
、
、
、
因此,荷兰每年都会举行一项名为"Top2000“
的
广播活动,人们可以投票选出他们最喜欢
的
艺术家和歌曲。我觉得分析一下音乐和艺术家
的
喜好会很酷。为此,我需要朗读投票列表上
的
艺术家/歌曲,这些列表是通过网址与我共享
的
,例如 one。我已经尝试了webread,urlread
和
wget来
下载
网页
,如下所示: url = 'https://stem.nporadio2.nl/top2000/
浏览 2
提问于2018-12-03
得票数 0
1
回答
如何在Mac上
使用
Selenium
WebDriver?
、
、
、
我目前正在学习如何
使用
Python
(3.7)实现自动化。 因此,首先,我在我
的
MacBook (Mojav10.14.1)上安装了带有Homebrew
的
Selenium
独立服务器3.141.5。我认为这将是一个简单
的
方法,安装是成功
的
。在此之后,我
使用
了一个小
Python
脚本来用
Selenium
测试火狐webDriver --只是为了看看一切是否正常,但
没有
.Users/Sandra
浏览 0
提问于2018-11-14
得票数 0
回答已采纳
2
回答
beautifulsoup4 find_all在沃尔玛杂货
网站
上找不到任何数据
、
、
、
我试图从url链接
的
中
抓取
一些基本
的
产品信息,但是bs4 div命令找不到任何数据,因为给定了与产品find_all关联
的
类名。'lxml')print(product_list) 但是这会打印一个空
的
列表查看了Chrome上
的
网页
,我知道'productListTile‘是正
浏览 25
提问于2021-06-05
得票数 2
1
回答
用
Python
/
Selenium
进行棘手
的
下拉选项选择
、
我正在
使用
Python
和
Selenium
浏览一个
网站
。TypeError: can't access dead obj
浏览 3
提问于2016-12-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
《权力的游戏》最终季上线!谁是你最喜爱的演员?这里有一份Python教程
Python系列教程(6)-利用 selenium 自动化网页操作
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
使用多个Python库开发网页爬虫(二)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券