腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用
python
中的urllib下载
网页
(mhtml格式)
、
、
、
、
如何
保存
网页
(包括其中的
内容
),使其可以脱机查看,使用
python
语言中的urllib?urllib.request.urlretrieve("http://www.yahoo.com", C:\\Users\\karanjuneja\\Downloads\\kj\\yahoo.mhtml") 这可以在文件夹中创建
网页
的另外,是否有一种以MHTML格式
保存
网页
的替代方法,包括在线显示的
所有
内容<
浏览 4
提问于2017-03-23
得票数 0
回答已采纳
1
回答
使用
python
pandas的Datareader获取雅虎财经的关键统计
网页
与默认的雅虎财经的历史价格
网页
、
、
、
我正在尝试使用
python
的pandas库从雅虎财经中抓取数据,使用DataReader从熊猫中提取历史价格数据,但我也想从雅虎财经的关键统计
网页
中提取数据,比如“价格/账面比”。我想使用pandas库来做我
所有
的
网页
抓取,pandas中有没有不同的函数可以让我为雅虎财经的不同
网页
拉取数据,或者修改DataReader函数来拉取其他数据?就像将
所有
内容
都
保存
在HTML中?
浏览 0
提问于2015-08-17
得票数 0
1
回答
在urllib2.urlopen()中缺少
内容
、
、
正在通过发送请求来解析
网页
,page = urlfile.read()这里的问题是,在响应urllib2.urlopen()时,
网页
中的一些
内容
丢失了如果我
保存
了页面,就会得到
所有
的
内
浏览 3
提问于2014-01-15
得票数 0
回答已采纳
1
回答
从URL检索文件并使用正确的扩展名
保存
这些文件
、
我想创建一个简单的
Python
为基础的实用程序,可以获得
所有
的下载网址从
网页
和下载的
内容
。我找到了几种这样做的方法,我发现最好的方法是"urllib“。但不幸的是,我的问题是我不能
保存
那些具有适当扩展名的URL,因为URL如下所示。但是
内容
可以是不同的格式,即.mp3、.ogg等。如何识别类型并使用正确的扩展名
保存
这些
内容
。
浏览 10
提问于2017-08-03
得票数 0
回答已采纳
2
回答
Python
,另存为mht
我可以打开一个
网页
,没问题。我可以
保存
webpage...as html,没问题。我需要
保存
为mht的
网页
,所以我可以得到
所有
的html被隐藏,而不是
保存
为mht。在研究中,我完全没有想到如何使用
python
将mht
保存
为mht。urllib.request.urlopen(url).read() m.write(str(html)) m.clo
浏览 2
提问于2016-12-07
得票数 1
2
回答
在不使用BeautifulSoup或urlib库的情况下,解析和提取html web
内容
中的urls。
、
、
、
、
我是
python
的新手,如果我的问题是非常基本的,我很抱歉。在我的程序中,我需要解析一个html
网页
并提取其中的
所有
链接。假设我的
网页
内容
如下所示: <html><head><title>Fakebook</title><style TYPE="text/css"><!,并提取其中的
所有
链接。所以我需要手动解析我的
网页
内容
。我的想法是,将
网
浏览 0
提问于2017-09-17
得票数 0
回答已采纳
1
回答
使用请求在
Python
中不使用Javascript进行Web抓取
、
、
、
、
因此,我正在制作一个
Python
脚本,该脚本获取
网页
内容
,并将其与之前
保存
的版本进行比较,以查看
网页
是否发生了更改。我使用以下方法获取原始
内容
: def getcontent(url): str = str.text return(str) 在那之后,我对
内容
做了一些清理,并引用了转义等等,但这是无关紧要的。我一直遇到的问题是,
网页
有一些JavaScript代码,生成一个唯一的密钥
浏览 18
提问于2020-04-15
得票数 0
回答已采纳
1
回答
如何在
python
代码中调用Nodejs api?
、
、
我正在自动化用Nodejs编写的功能,并在调用
网页
时提供图形视图。我需要在一个文件中检索
网页
内容
。
所有
这些代码都将用
python
编写。如何在
python
代码中调用
网页
api,以便获取文件中的
所有
内容
。
浏览 12
提问于2019-01-22
得票数 0
1
回答
如何在每次刷新html页面时刷新
python
文件?
我想在每次刷新HTML页面时重新运行我的
python
文件。我该怎么做呢?str_product[8] }}</div> </div> </div>
Python
浏览 21
提问于2021-07-24
得票数 1
回答已采纳
2
回答
保存
网页
内容
(php)
、
、
如何
保存
网页
的状态(可能
保存
到文件中),以便用户稍后可以查看(在现有锻炼部分中)?
浏览 0
提问于2009-04-17
得票数 0
2
回答
用
Python
解析CSS属性值的HTML
、
、
、
、
我目前正在使用Selenium和PhantomJS与
Python
一起抓取呈现的
网页
。很容易检查HTML
内容
中是否存在某个单词(例如。)例如,最理想的做法是抓取一个站点列表,并
保存
具有CSS为元素提供z索引的页面,这个值异常大。
所有
内容
都是构建的,除了呈现的页面的CSS爬行功能。有人对此有什么建议吗?
浏览 8
提问于2015-01-06
得票数 0
回答已采纳
1
回答
浏览器不显示上的更改--使用Windows
、
、
、
请阅读以下
内容
: 在完成了对tomcat的context.xml的这些更改之后,我只需要重新启动tomcat,一切都按照正常情况进行。
浏览 4
提问于2015-02-21
得票数 1
2
回答
如何
保存
包含块
内容
的整个
网页
我想
保存
一个
网页
。我使用
python
urllib来解析
网页
。但我找到了
保存
的文件,其中一些
内容
丢失了。从源
网页
中阻止缺少的部分,例如此部分<div style="display: block;" id="GeneInts">...</div>。我不知道如何在没有阻塞的情况下解析整个页面。
浏览 2
提问于2010-08-11
得票数 1
1
回答
javascript
保存
网页
中的html
、
、
当我输入时,可以右击并
保存
HTML,这也可以从javascript中实现。这是可能的吗?我如何在javascript中做到这一点? Br Bo
浏览 5
提问于2018-09-26
得票数 0
1
回答
Requests.get不在
网页
上
保存
图像
、
当我右键单击一个页面,然后单击另存为并将其另存为html时,它会
保存
页面上的
所有
内容
,包括图像。但是,当我使用
python
的requests.get时,它会
保存
html页面,而不
保存
图像。它们显示为断开的链接,如下所示: Broken images 而不是像这样: Working images 如何让requests.get获取
网页
上的
所有
数据?感谢您的建议。
浏览 14
提问于2021-03-19
得票数 0
1
回答
python
如何动态获取
网页
的
所有
内容
使用selenium.webdriver登录Facebook并获取公众人物(如 )的html页面,可能需要从该页面抓取帖子
内容
。我发现使用selemium.webdriver,只获取当前页面的
内容
,例如,当登录facebook并想获取的
所有
网页
内容
时,我得到的只是当前屏幕中的几个帖子,但实际上,页面中的帖子(
内容
)太多了。我会多次滚动鼠标滚轮,页面可以到达底部,但现在我得到的只是当前屏幕中的有限
内容
,请告诉我解决方法,或者告诉我除了selenium之外的其他方法或库可以
浏览 3
提问于2017-04-04
得票数 0
1
回答
有没有什么东西可以截取网站
内容
的屏幕截图并裁剪出布局?
、
、
、
、
我正在尝试获取一个excel文件,使用
python
为javascript html
网页
生成一个xml,该
网页
基本上会显示一个图库(或某种目录结构)。到目前为止,我可以转换的制表符分隔的版本的excel电子表格到XML,我有
所有
的链接…现在,我只需要打开浏览器,截取屏幕截图并以正确的方式裁剪它们,或者以某种方式
保存
web
内容
的某些部分。我正在考虑使用selenium作为网络爬虫,然后使用autoit execute键盘命令来
保存
所有
的
网页</em
浏览 1
提问于2010-01-14
得票数 0
回答已采纳
1
回答
下载呈现器
网页
(从CLI)
、
、
动态
网页
很难提取
网页
的全部
内容
。尤其是那些在页面被浏览时生成“动态”的
内容
。这些
内容
不能用curl/wget
保存
,甚至当您在浏览器中查看
网页
时也不能
保存
(ctrl+S通常只
保存
简单的源代码和图像之类的直接依赖项。但不是动态
内容
:用Firefox测试)。有任何方式(或浏览器html5功能),谁能够存储整个动态
内容
集(某种“快照”html源后,下载了整个
内容
(包括动态
浏览 4
提问于2017-06-09
得票数 0
1
回答
有没有
Python
命令可以返回夹在两个标识符之间的字符串?
、
我从
网页
html中抓取值,如下所示:我成功地使用了
Python
的分区两次:一次是
保存
ID字符串MAIN BUILDING</a> :之后的
所有
内容
,另一次是
保存
<br />之前的部分 使用分区两次似乎并不太可怕。
浏览 0
提问于2017-05-03
得票数 0
2
回答
用php获取页面中的
所有
<a>标签href
、
我试图在一个
网页
上获得
所有
外部链接,并将其存储在数据库中。我把
所有
的
网页
内容
放在变量中:如何
保存
所有
外部链接??例如,如果
网页
包含如下代码: <a href="http://othersite.com">other site</
浏览 0
提问于2018-05-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python爬虫:爬取笔趣小说网站首页所有的小说内容,并保存到本地
PPT所有内容保存成无缝隙长图的操作教程
查看网页保存的密码
利用Python检测网页文本内容并标定屏幕坐标
微信保存网页整页图片方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券