在Pandas DataFrame中使用正则表达式条件创建新列的方法是使用str.contains()
函数。该函数可以用于检查DataFrame中某一列的值是否满足正则表达式条件,并返回一个布尔值的Series。
下面是一个完整的示例代码:
import pandas as pd
# 创建一个示例DataFrame
data = {'Name': ['John', 'Mike', 'Sarah', 'Amy'],
'Age': [25, 30, 35, 40],
'Email': ['john@example.com', 'mike@example.com', 'sarah@example.com', 'amy@example.com']}
df = pd.DataFrame(data)
# 使用正则表达式条件创建新列
df['Has_Gmail'] = df['Email'].str.contains(r'@gmail\.com', regex=True)
# 打印结果
print(df)
输出结果如下:
Name Age Email Has_Gmail
0 John 25 john@example.com False
1 Mike 30 mike@example.com False
2 Sarah 35 sarah@example.com False
3 Amy 40 amy@example.com False
在上述示例中,我们使用str.contains()
函数检查Email
列中的值是否包含@gmail.com
,并将结果存储在新的Has_Gmail
列中。如果满足条件,则对应位置的值为True,否则为False。
推荐的腾讯云相关产品:腾讯云云服务器(CVM),产品介绍链接地址:https://cloud.tencent.com/product/cvm
领取专属 10元无门槛券
手把手带您无忧上云