文章/答案/技术大牛

发布

在也不用996！如何用Python轻松取代Excel

文章来源：企鹅号 - python天天学

概述

excel占领办公领域已经大半个世纪，进入人工智能新时代后，其霸主地位受到python等语言和工具的挑战。编程不再是专业人士的专利，而是“飞入寻常百姓家”的日用工具了，在前面那篇表哥表姐！是时候扔掉Excel了文章里，已经阐明了这个观点。

用Python来做Excel的活

接下来，我们会用更实际的例子来证明Python已经是Excel无可比拟的对手，是Excel的掘墓人。在这些例子里会展示一些常见的Excel任务以及如何在python的pandas中执行类似的任务。虽然例子有些微不足道，但足够能体现用python来化繁为简的创造性的解决问题的能力呢。

向行添加总和

介绍的第一项任务是汇总列数据，并添加总列。

首先将excel数据导入到pandas数据帧中。

第一项任务是汇总一些列以添加总列

结果如下：

接下来，进行求和：

接下来，按每个月汇总。以下是执行的操作，如Excel中所示：

如上图所示，在excel中用 SUM(G2:G16) 在每列中添加了第17行，以按月获得总计。

这种列操作在python中简直是小意思。

自动纠错转换

再举一个例子，将状态缩写添加到数据集中。

自动纠错转换

从Excel的角度来看，最简单的方法可能是添加一个新列，对州名进行vlookup并填写缩写。

这里是excel操作结果：

您会注意到执行vlookup后，有些值无法正确显示。那是因为拼错了一些州。在在大数据集情况下，Excel中处理这将是非常具有挑战性的。

幸运的是，python可以搞定，而且非常容易。wuzzy库非常棒，可以自动纠错。

首先安装wuzzy 库。

首先导入适当的fuzzywuzzy函数并定义我们的状态映射字典。

以下是wuzzy模糊文本匹配功能如何工作的一些例子。

现在我们知道它是如何工作的，创建函数来获取状态列并将其转换为有效的缩写。对此数据使用80 score_cutoff。您可以使用它来查看适用于您的数据的数字。你会注意到要么返回一个有效的缩写，要么np.nan 字段中有一些有效的值。

在想要的位置添加列，并用NaN值填充它:

使用 apply 将缩写添加到approriate列中。

一个非常简单的智能清理数据功能开发完毕。当数据只有15行左右时，这不是什么大问题。但是，如果有15,000呢？难道你想在Excel中一行行手动来处理这些?

分类汇总

本文的末尾，按州汇总一些数据。

在Excel中，将使用该 subtotal 工具执行此操作。

输出看起来像这样：

在pandas中创建小计是使用groupby来实现汇总。

接下来，通过使用 applymap 数据框中的所有值将数据格式化为货币。注意，定义的money函数，用在apply里很高效。

处理后的格式看起来不错，接下来按月份进行汇总。

将值转换为列并对其进行格式化。

最后，将总值添加到DataFrame。

您会注意到数据的最末尾索引为“0”。如何重命名为一个有意义的名字呢？用 rename 。

最后发现，索引变为了Total，一切都很完美了！

结论

希望本文能帮助到那些希望替换掉Excel并换用Python的朋友。希望这些例子可以帮助其他人相信他们可以用Python来避免大量Excel数据操作。如果您有其他Excel操作，自己试验过，但是仍然没成功，而且想要学习如何在python里来进行相应操作，请通过以下评论告诉我，我会尽力提供帮助。

发表于: 2019-07-052019-07-05 09:41:59
原文链接：https://kuaibao.qq.com/s/20190705A05YU800?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

在也不用996！如何用Python轻松取代Excel

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐