首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    爬取网站文章将图片保存到本地并将HTML的src属性更改到本地

    每次当你爬取一篇文章时,不管是从csdn或者其他网站,基本内容都是保存在一个富文本编辑器中,将内容提取出来还是一个html,保存之后图片还在别人的图片服务器上。...我今天要说的就是将图片保存之后并将它的src属性替换成本地的地址。并且以次替换,按照原文章排版顺序替换。 话不多说,直接上代码 #!...# 保存图片 # urllib.request.urlretrieve(imgurl, 'img/%s.jpg' % x) # 根据每个图片的src的内容进行替换...html = re.sub(imglist[i], "G:/pachong/img/%s.jpg" % str(i), html) x += 1 print(html) html...= getHtml("http://tieba.baidu.com/p/2460150866") print(getImg(html)) 这个demo知识贴吧的一个帖子里的图片,大家可以依据自己的需求去更改此代码

    1.9K31

    HTML图片标签学习

    html> 图片标签学习 图片标签学习:...--使用本地资源:图片位于本地电脑中--> 战斗天使:阿丽塔 ...图片标签学习: 图片标签: img src:图片路径 本地资源路径:一般本地图片资源使用相对路径即可 网络资源路径:图片资源的URL地址 width:设置图片的宽度...,如果是单独设置,则再图片保证不失真的情况下自动缩小或者放大 单位可以是px也可以是百分比 height:设置图片的高度,如果是单独设置,则再图片保证不失真的情况下自动缩小或者放大...单位可以是px也可以是百分比 title:图片标题,鼠标放在图片上的时候会显示 alt:图片加载失败后的提示语 注意:图片是不会自动换行的(行内元素) **注意** 相对路径:

    4K10
    领券