Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python常用第三方库大盘点

Python常用第三方库大盘点

作者头像
吾非同
发布于 2020-10-13 05:22:14
发布于 2020-10-13 05:22:14
3.5K0
举报
文章被收录于专栏:吾非同吾非同

Python语言有超过12万个第三方库,覆盖信息技术几乎所有领域。下面简单介绍下网络爬虫、自动化、数据分析与可视化、WEB开发、机器学习和其他常用的一些第三方库,如果有你感兴趣的库,不妨去试试它的功能吧。

1、网络爬虫

  • requests-对HTTP协议进行高度封装,支持非常丰富的链接访问功能。
  • PySpider-一个国人编写的强大的网络爬虫系统并带有强大的WebUI。
  • bs4-beautifulsoup4库,用于解析和处理HTML和XML。
  • Scrapy-很强大的爬虫框架,用于抓取网站并从其页面中提取结构化数据。可用于从数据挖掘到监控和自动化测试的各种用途
  • Crawley-高速爬取对应网站的内容,支持关系和非关系数据库,数据可以导出为JSON、XML等
  • Portia-可视化爬取网页内容•cola-分布式爬虫框架
  • newspaper-提取新闻、文章以及内容分析
  • lxml-lxml是python的一个解析库,这个库支持HTML和xml的解析,支持XPath的解析方式

2、自动化

XlsxWriter-操作Excel工作表的文字,数字,公式,图表等•win32com-有关Windows系统操作、Office(Word、Excel等)文件读写等的综合应用库•pymysql-操作MySQL数据库pymongo-把数据写入MongoDBsmtplib-发送电子邮件模块•selenium-一个调用浏览器的driver,通过这个库可以直接调用浏览器完成某些操作,比如输入验证码,常用来进行浏览器的自动化工作。•pdfminer-一个可以从PDF文档中提取各类信息的第三方库。与其他PDF相关的工具不同,它能够完全获取并分析 P D F 的文本数据•PyPDF2-一个能够分割、合并和转换PDF页面的库。•openpyxl- 一个处理Microsoft Excel文档的Python第三方库,它支持读写Excel的xls、xlsx、xlsm、xltx、xltm。•python-docx-一个处理Microsoft Word文档的Python第三方库,它支持读取、查询以及修改doc、docx等格式文件,并能够对Word常见样式进行编程设置。

3、数据分析及可视化

  • matplotlib-Matplotlib 是一个 Python 2D 绘图库,可以生成各种可用于出版品质的硬拷贝格式和跨平台交互式环境数据。Matplotlib 可用于 Python 脚本,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 应用程序服务器和各种图形用户界面工具包。”
  • numpy-NumPy 是使用 Python 进行科学计算所需的基础包。用来存储和处理大型矩阵,如矩阵运算、矢量处理、N维数据变换等。
  • pyecharts-用于生成 Echarts 图表的类库
  • pandas-一个强大的分析结构化数据的工具集,基于numpy扩展而来,提供了一批标准的数据模型和大量便捷处理数据的函数和方法。
  • Scipy: 基于Python的matlab实现,旨在实现matlab的所有功能,在numpy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。
  • Plotly-Plotly提供的图形库可以进行在线WEB交互,并提供具有出版品质的图形,支持线图、散点图、区域图、条形图、误差条、框图、直方图、热图、子图、多轴、极坐标图、气泡图、玫瑰图、热力图、漏斗图等众多图形
  • wordcloud-词云生成器
  • ieba-中文分词模块

4、WEB开发

  • Django-一个开放源代码的Web应用框架,由Python写成。是Python生态中最流行的开源Web应用框架,Django采用模型、模板和视图的编写模式,称为MTV模式。
  • Pyramid是一个通用、开源的Python Web应用程序开发框架。它主要的目的是让Python开发者更简单的创建Web应用,相比Django,Pyramid是一个相对小巧、快速、灵活的开源Python Web框架。
  • Tornado-一种 Web 服务器软件的开源版本。Tornado和现在的主流Web服务器框架(包括大多数Python的框架)有着明显的区别:它是非阻塞式服务器,而且速度相当快
  • Flask是轻量级Web应用框架,相比Django和Pyramid,它也被称为微框架。使用Flask开发Web应用十分方便,甚至几行代码即可建立一个小型网站。Flask核心十分简单,并不直接包含诸如数据库访问等的抽象访问层,而是通过扩展模块形式来支持。

5、机器学习

  • NLTK-一个自然语言处理的第三方库,NLP领域中常用,可建立词袋模型(单词计数),支持词频分析(单词出现次数)、模式识别、关联分析、情感分析(词频分析+度量指标)、可视化(+matploylib做分析图)等。
  • TensorFlow-谷歌的第二代机器学习系统,是一个使用数据流图进行数值计算的开源软件库。
  • Keras -是一个高级神经网络 API,用 Python 编写,能够在 TensorFlow,CNTK 或 Theano 之上运行。它旨在实现快速实验,能够以最小的延迟把想法变成结果,这是进行研究的关键。
  • Caffe-一个深度学习框架,主要用于计算机视觉,它对图像识别的分类具有很好的应用效果。
  • theano-深度学习库。它与Numpy紧密集成,支持GPU计算、单元测试和自我验证,为执行深度学习中大规模神经网络算法的运算而设计,擅长处理多维数组。
  • Scikit-learn-是一个简单且高效的数据挖掘和数据分析工具,它基于NumPy、SciPy和matplotlib构建。Scikit-learn的基本功能主要包括6个部分:分类,回归,聚类,数据降维,模型选择和数据预处理。Scikit-learn也被称为sklearn。

6、其他常用

  • IPython-一个基于Python 的交互式shell,比默认的Python shell 好用得多,支持变量自动补全、自动缩进、交互式帮助、魔法命令、系统命令等,内置了许多很有用的功能和函数
  • PTVS-Visual Studio 的 Python 工具
  • pydub-支持多种格式声音文件,可进行多种信号处理、信号生成、音效注册、静音处理等
  • TimeSide-能够进行音频分析、成像、转码、流媒体和标签处理的Python框架
  • dnspython-DNS工具包
  • pygame-专为电子游戏设计的一个模块
  • PyQt5-pyqt5是Qt5应用框架的Python第三方库,编写Python脚本的应用界面
  • PIL(Pillow)-PIL库是Python语言在图像处理方面的重要第三方库,支持图像存储、显示和处理,它能够处理几乎所有图片格式,可以完成对图像的缩放、剪裁、叠加以及向图像添加线条、图像和文字等操作。
  • OpenCV-图像和视频工作库
  • Py2exe: 将python脚本转换为windows上可以独立运行的可执行程序。
  • WeRoBot 是一个微信公众号开发框架,也称为的微信机器人框架。WeRoBot可以解析微信服务器发来的消息,并将消息转换成成Message或者Event类型。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 吾非同 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
有温度的数据,需要有温度的存储
数据分层存储技术主要应用在混闪存储系统设计,可根据数据冷、热、温的特点,合理调度使用SSD、HDD等不同介质类型的存储资源,降低存储系统的初始购买成本。
用户5498443
2021/02/19
1.4K0
纵横布局,传统硬盘厂商的突围
硬盘是构成存储系统的最关键部件,对于机械硬盘而言,看似并不太复杂的机械部分,其实细究起来,到处都是无法逾越的技术门槛,一般人还真做不了。回想20几年前,机械硬盘领域有众多品牌,比如西部数据、东芝、迈拓、IBM、希捷、三星等。彼时长城硬盘也开始尝试自主研发,但是发现这个东西坑太多,很多关键技术搞不定,且一些关键器件必须从日本进口,最终还是放弃了。如下图所示,磁头和磁头臂又是机械硬盘里最关键的部分,其复杂和精细度极高。
冬瓜哥
2020/12/18
1.1K0
纵横布局,传统硬盘厂商的突围
当“数据为中心”时代来临
熟悉存储发展趋势就会知道:如今冯·诺依曼架构备受挑战,简单说,当数据为中心时代到来,要求计算围着数据转,以减小数据搬移带来的性能瓶颈以及功耗,所谓解决“存储墙”问题,而冯·诺依曼架构是一个以计算为中心的架构,新的时代要求创新的架构。
用户5498443
2021/08/25
1.3K0
将存储分层进行到底
我一直试图在传统集中式存储和分布式存储应用之间找到一条界线,尽管有交叉和重叠,但还是应该有一条界线:哪些适合集中式存储,哪些适合分布式存储。但是这条界线我一直也没有找到,因为既不能按性能划分,也不能按照容量划分,如果按照业务稳态、敏态类型划分也不合适,总之没有一条清晰界线。
用户5498443
2021/07/29
4090
架构万亿字节新时代:分区存储技术SMR和ZNS磁盘来了!
IT圈的人都知道有个“摩尔定律”,但摩尔定律也面临着失效。摩尔定律失效的原因在于,半导体制程工艺逼近了极限。
用户5498443
2019/06/19
1.3K0
架构万亿字节新时代:分区存储技术SMR和ZNS磁盘来了!
冷数据,三大战役的锦州之战
解放战争三大战役之中,一般认为最重要的是淮海战役,其实应该是辽沈战役,正是因为辽沈战役获胜,解放军快速入关,才有平津战役的胜利。
用户5498443
2020/09/10
1K0
冷数据,三大战役的锦州之战
西部数据:What’s Next,说自己,也说用户!
宋·宋祁《学舍昼上》:“扪心自问何功德,五管支离治繲人。”这是成语“扪心自问”的出处,意思是向自己发问,自我反省。对于存储市场,What’s Next?新的“风口”会是什么?应该做哪些准备?这是存储
用户5498443
2022/08/30
4460
西部数据:What’s Next,说自己,也说用户!
硬盘将数据中心消失?—分析师是这么看的!
西部数据(Western Digital)依然认为机械硬盘在数据中心拥有一席之地。近日,西部数据公布了最新的机械硬盘产品路线图。西部数据计划在2020年会推出18TB、20TB的硬盘,并预计在在2026年推出60TB的机械硬盘。西部数据的路线图比两年前ASTC协会公布的要保守一些,后者之前预计2026年HDD硬盘容量能达到100TB级别。
大数据在线
2020/02/25
7710
存储技术新势力成就新一代绿色数据中心
摘要 本次主题将分别从存储介质的发展、硬盘以及闪存的创新技术上逐步分析介绍,新一代的绿色数据中心是如何打造的。 嘉宾演讲视频及PPT回顾:http://suo.im/2oxNfL 存储介质技术发展 CPU的1、2、3级Cache和DRAM(内存)的存储速度非常快,可以达到纳秒几倍级别,但是容量受限的,DRAM(内存)也只有16-128G。 非易失性存储介质包括硬盘和最近几年兴起的SSD固态硬盘,它们是目前最主要的存储部件。最近西部数据又开发了一个新的存储技术——存储级内存,它不光可以进行存储介质的保存还有着
IT大咖说
2018/04/03
8550
数据存储需求多样化加剧,分而治之成大势所趋
数字经济时代,作为关键生产要素,数据正在重塑企业/组织的运营、管理和决策,乃是一切创新的基础。
大数据在线
2022/09/04
3960
数据存储需求多样化加剧,分而治之成大势所趋
据传,Memblaze将于6月初........!
广告:冬瓜哥新作《大话计算机——计算机系统底层架构原理极限剖析》将于8月份出版。
冬瓜哥
2019/06/10
6340
据传,Memblaze将于6月初........!
“东数西算”正式启动,西部数据带你看清存储新趋势
国家发改委、工信部等机构联合印发通知,同意在京津冀、粤港澳大湾区、宁夏等8地启动建立国家算力枢纽节点,并规划10个国家数据中心集群。这标志着全国一体化大数据中心体系设计布局完成,“东数西算”工程正式全面启动。
大数据在线
2022/04/06
5420
“东数西算”正式启动,西部数据带你看清存储新趋势
WD:加速云原生 Zoned Storage
4. Linux支持Zoned Storage生态系统成熟,多个发行版和工具库都已支持。
数据存储前沿技术
2025/02/11
1790
WD:加速云原生 Zoned Storage
西数今年推出20TB HDD硬盘:MAMR革命来临
随着希捷、东芝先后推出16TB容量的HDD硬盘,现今的垂直磁道PMR机械硬盘不论容量还是技术水平应该是到头了,西数计划今年出样18TB及20TB的硬盘,会用上MAMR全新技术。
Debian中国
2020/01/21
7600
闪存时代来临,如何才能不落伍?
作为《大话存储 终极版》以及《大话存储后传》的作者,我有幸经历了国内存储行业发展的启蒙和鼎盛时代。在2005年到2013年这8年间,存储市场基本就是SAN的市场,谈存储必暗指SAN。但是从2014年往后,存储行业突然发生巨大变化,分布式系统和固态存储介质开始爆发式增长。今天,谈存储如果不谈一谈配以固态硬盘的分布式系统,就仿佛是上个时代的人了。
冬瓜哥
2019/06/10
1.3K0
闪存时代来临,如何才能不落伍?
103ZB数据存不下,存储技术需要另辟蹊径
首先让我们看一组数据:2018年全球产生的数据量是32ZB,预计2023年会达到103ZB。其中,有多少数据被保留下来了呢? 这里也有一组数据:2018年被保存下来的数据是5ZB,占比不足16%;预计
用户5498443
2019/09/12
7850
103ZB数据存不下,存储技术需要另辟蹊径
云存储硬核技术内幕——(10)
在前几期,我们提到了,在云计算时代,由于对存储IO及吞吐的要求迅速增加,传统SAN存储难以满足需求,基于标准x86节点的分布式存储成为了主流。
用户8289326
2022/08/04
7790
云存储硬核技术内幕——(10)
常规机械硬盘分类应用场景与硬盘接口存储方案介绍
Q: 磁盘基本组成结构的五个方面盘片(platter)/ 磁头(head)/ 磁道(track)/ 扇区(sector)/柱面(cylinder)?
全栈工程师修炼指南
2022/09/29
3K0
常规机械硬盘分类应用场景与硬盘接口存储方案介绍
从技术架构角度分析存储系统的发展方向
现有的存储系统经过长期发展,种类及其繁多,架构也各不相同,按照从底层到上层的思路,大致可以分为:物理层、协议层、架构层、连接层四个层次。接下来我们由下往上详细分析。
存储小白
2022/04/06
7000
存储极客丨 Scale-Out 与全闪存似乎天然配对儿
Scale-Out 的分布式系统为何离不开 SSD / 全闪存?如果没有闪存,Scale-Out 为什么就让人感觉火候不太够?而 Scale-Out 的出现,除了得益于闪存助力,还有什么其他因素么?本文冬瓜哥就来分析分析。
用户6543014
2019/10/25
8460
存储极客丨 Scale-Out 与全闪存似乎天然配对儿
推荐阅读
相关推荐
有温度的数据,需要有温度的存储
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档