在pandas中,可以使用str.extract()
方法对多个值应用正则表达式以创建新列。str.extract()
方法可以从一个字符串列中提取匹配正则表达式的内容,并返回一个新的列。
下面是一个示例代码:
import pandas as pd
# 创建一个包含多个值的DataFrame
data = {'col1': ['apple', 'banana', 'cherry'],
'col2': ['123', '456', '789']}
df = pd.DataFrame(data)
# 使用正则表达式提取数字
df['new_col'] = df['col2'].str.extract('(\d+)', expand=False)
print(df)
输出结果如下:
col1 col2 new_col
0 apple 123 123
1 banana 456 456
2 cherry 789 789
在上面的示例中,我们使用str.extract()
方法从col2
列中提取了每个字符串中的数字,并将提取的结果存储在了一个新的列new_col
中。
需要注意的是,str.extract()
方法的参数是一个正则表达式,用于匹配要提取的内容。在上面的示例中,我们使用了(\d+)
作为正则表达式,它表示匹配一个或多个数字。如果要提取其他类型的内容,可以根据需要修改正则表达式。
此外,对于正则表达式的详细语法和用法,可以参考正则表达式的相关教程和文档。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云