毋庸置疑,Pandas是使用最广泛的 Python 库之一,它提供了许多功能和方法来执行有效的数据处理和数据分析。
在本文中,我们将讨论 Pandas 中的 2 种不同的替换函数。
pandas.DataFrame.replace
pandas.Series.str.replace
DataFrame.replace
首先,我们需要先从创建一个DataFrame开始。
函数可用于替换一列或多列中的值。我们需要指定要替换的值和新值,
比如我们可以将“省份”这列中的“广西”替换为“广西壮族自治区”。
在交互式环境中输入如下命令:
输出:
我们也可以直接将函数应用到 上。在这种情况下,列名是用 Python 字典指定的。
在交互式环境中输入如下命令:
输出:
由于 Pandas 的灵活性,我们可以在一次操作中完成两种替换,不过每个替换都需要被写成字典中的键值对。
在交互式环境中输入如下命令:
输出:
目前我们所替换的都是Pandas中某列中值的整体,如果想只替换值的一部分,比如姓名中“-”,该怎么做呢?
Series.str.replace
实际上,我们在之前的文章《经常被人忽视的:Pandas 文本数据处理!》中就介绍过这种方法。
在交互式环境中输入如下命令:
输出:
在交互式环境中输入如下命令:
输出:
同样可以实现函数一样的效果。
我们已经了解了 Pandas 的两种不同的替换功能以及它们之间的区别。在某些情况下,其中一个是更好的选择,因此最好同时了解两者。
需要注意的是,这两个函数都支持正则表达式(即 regex),这使得它们更加灵活和强大。如果传递模式并希望将其作为正则表达式处理,只需将 regex 参数的值设置为 True。
人生苦短,快学Python!我们下篇文章见。
领取专属 10元无门槛券
私享最新 技术干货