腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
0
回答
python
web
抓取
代码
无法
打开
链接
、
、
这来自“用
python
自动化无聊的东西”这本书。一开始我做了一个.bat文件,并用cmd的参数运行它,没有在chrome中
打开
任何页面,在这里查找,修改了
代码
,它仍然可以完美地执行并打印打印行,但是它不能像它应该的那样
打开
选项卡。我做错了什么?
python
3searchTerm1= '
python
' p
浏览 1
提问于2018-07-20
得票数 1
回答已采纳
2
回答
BeautifulSoup不返回页面标题
、
、
、
我试着用Beautifulsoup4
python
模块通过
web
抓取
来获取网页的标题,它返回了一个字符串“
无法
接受!”作为标题,但是当我通过浏览器
打开
网页时,标题是不同的。我试着循环浏览
链接
列表和所有网页的标题,但是它返回的字符串是“不能接受的!”所有的
链接
。这里是
python
代码
import requests URL = 'https://
浏览 18
提问于2022-03-01
得票数 0
回答已采纳
1
回答
Web
通过
python
抓取
问题,不能读取html文件吗?
、
、
web
抓取
Python
已经有一段时间了,最近我遇到了这个问题。BeautifulSoup似乎
无法
读取html文件。例如,我正试着从这个网站上
抓取
from bs4 import BeautifulSoupurl_episode = 'https://www.thetvdb.comurl_episode) soup = BeautifulSoup(getdetail_episode.content,'html.parse
浏览 1
提问于2020-04-06
得票数 0
3
回答
使用
python
快速
抓取
动态内容
、
、
、
我正在尝试使用
Python
动态内容,它是在JavaScript中生成的(这个视频的浏览量和评论数:)。有没有一种方法可以在不使用浏览器的情况下
抓取
Python
语言中的JavaScript函数的结果(假设这就是降低Selenium速度的原因)?我的Selenium
代码
如下:from selenium import webdriver from selenium.webdriver.support.ui
浏览 0
提问于2015-12-15
得票数 3
2
回答
我不能
抓取
每个
链接
内容的具体时间段从确实
、
、
、
、
我是
python
和
web
scraping的新手。您的帮助我们将不胜感激。我在编程和练习方面是新手。我正在使用
python
和selenium进行
web
抓取
。 我正在试着从事实上
抓取
数据。目标是找到过去24小时内发布的所有工作,并刮刮外部
链接
,这是在工作详细信息页面上与
链接
文本“申请公司网站”,标题,公司,名称,位置,工作描述。我写了以下
代码
,但是它正确地获取了页面上的所有
链接
,然后当我试图
打开
每个<
浏览 33
提问于2020-07-15
得票数 1
回答已采纳
2
回答
如何使用下载
链接
在
Python
中下载文件
、
、
、
基本上,我正在尝试写一个脚本,将
抓取
网页上的某些文件,并下载到特定的文件夹。以下是问题所在。我可以
抓取
文件的下载
链接
,并且可以
打开
浏览器并弹出
打开
/保存小部件。但是,我不能再点击或实际向下删除该文件。由于某种原因,这被忽略了,我仍然盯着
打开
的浏
浏览 0
提问于2015-08-12
得票数 0
4
回答
检索广告URL
我想要做的可能是编写一个脚本来持续刷新页面并
抓取
广告URL。 有什么建议吗?
浏览 2
提问于2012-11-05
得票数 0
2
回答
在
python
中的csv文件中添加新的输出行
、
我是
Python
的新手&我有一个
web
抓取
器程序,可以检索
链接
并将它们放入.csv文件中。我需要在输出中的每个
web
链接
后添加新行,但我不知道如何正确使用\n。下面是我的
代码
: file.write(str(census_links)) file.write
浏览 11
提问于2017-12-30
得票数 2
回答已采纳
4
回答
在代理服务器后面运行selenium
、
、
、
、
我一直在使用selenium在
python
中进行自动浏览器模拟和
web
抓取
,并且对我来说效果很好。但是现在,我必须在代理服务器后面运行它。因此selenium现在
打开
窗口,但是由于在
打开
的浏览器上没有设置代理设置,所以
无法
打开
请求的页面。当前
代码
如下(示例):sel.get('http://www.goog
浏览 3
提问于2013-08-01
得票数 15
回答已采纳
1
回答
web
抓取
Tableau所需的支持
、
有没有办法将下面
链接
中的表格上传到tableau,它每天都在刷新?它只显示了25行。我需要把所有的行都放在那里。
浏览 11
提问于2021-01-15
得票数 0
回答已采纳
1
回答
如何在
python
crawler中访问多页表单的发布数据
、
、
我正在尝试用
python
抓取
pubmed,并获取一篇文章被引用的所有论文的pubmed ID。例如,这篇文章(ID: 11825149) 有一个
链接
到所有引用它的文章的页面:,问题是它有200多个
链接
,但每页只显示20个
链接
。
无法
通过url访问“下一页”
链接
。有没有办法
打开
“发送到”选项,或者用
python
查看下一页的内容?我当前如何
打开
pubmed页面: webpage =
浏览 0
提问于2013-05-25
得票数 2
回答已采纳
1
回答
抓取
问题:“检查元素”与“查看页面源”不同
、
、
、
、
当我看到带有浏览器(firefox和chrome)的“查看页面源”的页面源时,所有选项卡的页面源看起来也是相同的,而当我对其中一个选项卡使用“检查Elemnt”时,我看到我的目标内容以html形式显示的
代码
问题是,我
无法
通过
python
访问所需选项卡的内容,这是
web
世界中可用的典型
WEB
抓取
代码
。这些
代码
通常是基于bs4的。 有没有人有任何想法或示例
代码
来学习如何处理我的问题?
浏览 2
提问于2020-02-06
得票数 4
回答已采纳
1
回答
Microsoft
Web
矩阵
我希望这是一个非常简单的问题:有没有人知道可以有效地
抓取
使用Microsoft Matrix构建的站点的工具?我可以用
python
编写
代码
,但这会花费我很长的时间来完成这项任务,这是因为Matrix生成的HTML非常糟糕和丑陋。我试过
Web
Harvey、Helium Scraper,也试过Chrome的
Web
Scraper插件。WebHarvey在超文本标记语言上卡住了,
无法
加载后续页面。the能够从一个详细信息页面移动到另一个详细信息页面(后续
链接
被跟踪),但详细
浏览 0
提问于2015-07-20
得票数 2
1
回答
用Laravel和Selenium进行
Web
抓取
、
、
、
我目前正在使用
Python
进行
web
抓取
。我使用了Selenium和Beautifulsoup库来
抓取
。我最近知道Selenium适用于php/Laravel。我的问题是,我可以使用Laravel + Selenium
web
驱动程序
抓取
web
吗?如果是,你能给我提供一些
链接
或存储库,以便我学习吗?我被迫在我的
抓取
工作中使用php/Laravel,因为他们说php很容易在服务器上部署/执行来进行实时<em
浏览 19
提问于2019-11-19
得票数 0
1
回答
使用Selenium获取JavaScript函数调用值
、
、
、
、
我正在使用
python
抓取
网页,这对静态内容非常有用。我试图从页面中
抓取
一个url,但结果是,它是通过javascript调用返回的。为此,我使用selenium,但
无法
弄清楚如何实现它。如果您单击给定
链接
上的“大小图表”,就会看到一个弹出式
打开
,其中提到了尺寸指南。我怎样才能在我的程序中得到这个指南的网址? 我也面临着一个类似的问题,在以及获得尺寸指南。如果有人能指点这些
链接
,我会非常感激的。
浏览 2
提问于2015-05-27
得票数 0
回答已采纳
1
回答
使用BeautifulSoup对表中的
链接
进行
Web
抓取
返回NoneType和空表
、
我试图在网络上刮除所有的表格N-MFP2,然后
打开
链接
到
web
,在表单中刮取信息。然而,我仍然
无法
检索表单。我尝试了多种
web
抓取
方法,包括beautifulSoup和selenium,但是返回的内容是空的,
无法
进一步获取行数据。感谢你的帮助,因为我已经为这个问题做了三个多小时了。我的
代码
如下:url = 'https://www.sec.gov/edgar
浏览 3
提问于2022-01-13
得票数 -3
1
回答
网页
抓取
当前的镀铬标签
、
、
、
、
目前,我知道你可以通过首先定义一个URL,
打开
它,然后读取信息来进行
web
抓取
。然而,我正在寻找一种从当前
打开
的窗口中获取信息的方法。有没有办法从
打开
的chrome标签页上进行屏幕/网页
抓取
?
浏览 4
提问于2021-05-20
得票数 0
1
回答
如何强制通过javascript调用的
链接
在新选项卡中
打开
、
我正在尝试
抓取
一个通过javascript
打开
超
链接
的网页,如下所示。我在
Python
中使用Selenium。href="javascript:openlink('120000020846')"></a> 通过使用XPATH,我能够使用以下
Python
代码
打开
超
链接
。(),&qu
浏览 0
提问于2018-04-02
得票数 0
2
回答
Python
抓取
包含PHP的页面源
代码
、
我知道如何
抓取
源
代码
HTML,但不知道PHP,有没有可能用内置的函数?
浏览 0
提问于2013-02-25
得票数 0
回答已采纳
1
回答
我的for循环在我的gamestop的刮板上没有被读取
、
、
、
我
无法
读取他的for循环并获取项目列表,它根本不打印任何内容,并跳过整个循环导入请求import re from bs4 import BeautifulSoup maxPages = 10 maxPages
浏览 0
提问于2018-08-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python数据抓取(3)—抓取标题、时间及链接
excel点击超链接时提示由于本机限制无法打开链接
手把手教你用Python进行Web抓取
推荐:手把手教你用Python进行Web抓取
python爬虫实战-抓取并清洗全国行政区划代码
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券