pandas是一个开源的数据分析和数据处理工具,它提供了丰富的数据结构和数据分析函数,可以方便地进行数据清洗、转换、分析和可视化等操作。
对于保留列值中的子字符串,可以使用pandas的str.contains()函数来实现。该函数可以用于判断某一列中的每个元素是否包含指定的子字符串,并返回一个布尔值的Series,表示是否包含子字符串。
下面是一个示例代码,演示如何使用pandas保留列值中的子字符串:
import pandas as pd
# 创建一个包含字符串的DataFrame
data = {'col1': ['apple', 'banana', 'orange', 'grape'], 'col2': ['pineapple', 'watermelon', 'kiwi', 'mango']}
df = pd.DataFrame(data)
# 使用str.contains()函数保留包含子字符串的行
substring = 'an'
df_filtered = df[df['col1'].str.contains(substring)]
# 打印结果
print(df_filtered)
输出结果为:
col1 col2
1 banana watermelon
3 grape mango
在上述代码中,我们创建了一个包含两列的DataFrame,然后使用str.contains()函数筛选出col1列中包含子字符串"an"的行,并将结果保存在df_filtered中。最后打印出筛选后的结果。
对于pandas的更多详细信息和用法,可以参考腾讯云的相关产品文档:腾讯云·Pandas。
需要注意的是,本答案中没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商,如有需要,可以自行参考官方文档或搜索引擎获取相关信息。
领取专属 10元无门槛券
手把手带您无忧上云