首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用Python爬取文章,并转PDF格式电子书

前言 前段时间,我在某个姓B的发了个视频,就是采集了自己的文章,转制成PDF格式的教程,CSDN居然给我举报了!!!...现在我来写一篇获取自己的文章,然后转制成PDF格式的电子式,看看能不能发出去 wkhtmltopdf [软件],这个是必学准备好的,不然这个案例是实现不出来的 获取文章内容代码 发送请求, 对于url地址发送请求...解析数据, 提取内容 保存数据, 先保存成html文件 再把html文件转成PDF 代码实现 请求数据 import requests # 数据请求模块 url = f'https://blog.csdn.net...html_path, mode='w', encoding=' utf-8') as f: f.write(article_content) print(title,'保存成功') 转制为pdf...文件 html_path = 'html\\ + title + '.html' pdf_path = 'pdf\\' + title + '.pdf' with open(html_path

44820
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    推荐 7 个 Vue2、Vue3 源码解密分析的重磅开源项目

    2.1 vue-analysis Vue.js 源码分析 目前社区有很多 Vue.js 的源码解析文章,但是质量层次不齐,不够系统和全面,这本电子书的目标是全方位细致深度解析 Vue.js 的实现原理...目前分析的版本是 Vue.js 的最新版本 Vue.js 2.5.17-beta.0,并且之后会随着版本升级而做相应的更新,充分发挥电子书的优势。...这本电子书是作为 《Vue.js 源码揭秘》 视频课程的辅助教材。...电子书是开源的,同学们可以免费阅读,视频是收费的,25+小时纯干货课程,如果有需要的同学可以购买来学习,但请务必支持正版,请尊重作者的劳动成果。...注意:文章的图片可能上传时会经过压缩,可能有点模糊,不过本文用到的 所有 超清图片 都已经放在 github 上,而且还有 pdf 格式、markdown 语法、思维导图 的原文件,自己可以根据 思维导图原文件

    2.5K20

    Python爬虫|人教版小初高教材下载及PDF电子书合成附可用工具!

    本渣渣号里不知道多少宝爸宝妈,如有需要自取,人教版小初高教材下载,单本书籍下载成图片并可合成PDF电子书,不过在线浏览电子书,即可,感觉又是搞了没什么软用的玩意......电子书 图片合成PDF电子书,也写了一个类,用的第三方库为:img2pdf、PIL,同时也用了classmethod 修饰符方法直接调用!...,output): print('\n开始合并图片成PDF...', 'wb') as f: f.write(img2pdf.convert(file_imgs)) print(f'保存到 {file}{output}.pdf...') 电子书教材图片获取 关键部分,其实没什么难度,需要自行添加书籍ID及页面页码总数,比较规律的页码,直接循环递增即可获取到所有电子书教材图片!

    87320

    别人的电子书,你的电子书,都在bookdown

    bookdown是著名R包作者谢益辉开发的,支持采用Rmarkdown (R代码可以运行)或普通markdown编写文档,然后编译成HTML, WORD, PDF, Epub等格式。...我们前面转录组和R培训的教案也是用bookdown写作的,后续再调整下格式,出一批电子书和纸质书,有意向和需求的欢迎联系。...Rscript -e "bookdown::render_book('index.Rmd', 'bookdown::pdf_book')" 在前面的内容运转起来后,再看后面的内容。...另外当目录下同时存在name1.png和name1.pdf文件时,会自动选择在HTML展示name1.png文件,在PDF输出中引入name1.pdf格式的文件。...', 'bookdown::pdf_book')" 配置全局变量自适应HTML和PDF输出 ```{r setup, include=FALSE} library(knitr) output <- opts_knit

    3.5K110

    python制作电子书

    文章目录 1. python制作pdf电子书 1.1. 准备 1.1.1. 安装wkhtmltopdf 1.1.2. python安装依赖包 1.2. pdfkit的用法 1.2.1....参考文章 python制作pdf电子书 准备 制作电子书使用的是python的pdfkit这个库,pdfkit是 wkhtmltopdf 的Python封装包,因此在安装这个之前要安装wkhtmltopdf...("陈加兵的博客",'demo.pdf') 这个是直接讲一个字符串转换成pdf格式的电子书...html格式的文件 进阶 当然知道这个是多么枯燥,生成的电子书书也不能添加各种的样式,下面我们将会介绍一些添加的样式的方法 options 这个参数是上面函数的可选参数,其中制定了一些选项,详情请见...) 写入文件的时候不想python3一样可以指定编码格式,这里我使用的是codecs库,可以向python3一样指定其中的编码格式 实战 本人爬了廖雪峰老师的python2.7的教程,并且做成了电子书

    1.6K40

    博客生成静态站点工具 Top 20

    此外,将生成电子书形式的静态站点,可以托管到其他平台,达到了备份的效果。 本文将介绍最流行的十大博客静态站点生成工具,以 Github star 数来排名。...VuePress 是一个基于 Vue.js 的静态网站生成器,由 Vue.js 官方团队维护和开发。VuePress 的目标是用于快速搭建文档型网站,并且可以支持自定义主题、插件等功能。...相比于其他静态网站生成器,Gridsome 的主要优点在于其高度可定制性和灵活性,因为它是基于 Vue.js 构建的,所以您可以使用所有 Vue.js 的功能和插件来定制您的网站。...Sphinx 是一个用于创建技术文档的工具,可以将文本文件(如reStructuredText、Markdown等)转换成HTML、PDF、EPUB等格式。...多种输出格式:Sphinx支持生成HTML、PDF、EPUB等多种格式的文档,方便发布和分享文档。 社区支持:Sphinx 是一个开源项目,有庞大的社区支持和开发者社区,您可以轻松地获取帮助和支持。

    3.6K21

    Gitbook电子书编写工具

    简述 GitBook是一个非常酷的电子书编写工具,之前在学Git的时候就曾经接触过一个叫"ProGit"的电子书,我们可以在很多网站上都可以直接以静态网页的形式浏览他,比如这里和这里,非常的酷。...文档 GitBook的官方文档在这里,对很多细节还是交代的非常详尽的,包括安装、文件含义、配置信息、导出PDF、导出静态页面、甚至还不厌其烦的再次解释了Markdown的用法。...测试效果 下面就是照着教程搭建好环境后随便写的一个测试文档,可以看出来用他导出的pdf层次清晰、页面干净,导出的默认静态页面也非常清新: 默认导出的pdf: 可以看出他自动添加了索引、页眉页脚,版式也很漂亮

    96010

    借助 PyPDF2 库把数据分析系列教程文章制作成了PDF电子书,欢迎来领取!

    合并 PDF 并添加书签 对于合并PDF,已经有很多成熟的代码了,我们拿来直接使用 from PyPDF2 import PdfFileReader, PdfFileWriter def merge_pdf...(i)[-1] == '.pdf': pdf_list.append(i) print(pdf_list) merge_pdf(pdf_list, outfn)...pdf_output.addPage(pdf_input.getPage(i)) pdf_output.write(open(outfn, 'wb')) add_bookmark(pdf_mark_list..., outfn) return pdf_mark_list, outfn 这样运行代码,就可以得到一个带有书签的PDF文档啦 电子书介绍 一直关注的朋友应该知道,在2020年我断断续续的更新了两个系列教程...而数据分析入门已经完成,感兴趣的朋友可以翻看往期的推文查看 如果你觉得来来回回翻看推文太不方便了,没关系,在公众号后台回复“电子书”,就可以免费获取这本入门教程电子书了,满满的诚意哦! ?

    46110
    领券