是一种基于正则表达式的方法,用于从字符串列中提取出符合特定模式的子字符串,并将其作为新的多级索引添加到数据帧中。
具体步骤如下:
import pandas as pd
data = {'Name': ['John Doe', 'Jane Smith', 'Mike Johnson'],
'Email': ['john.doe@example.com', 'jane.smith@example.com', 'mike.johnson@example.com']}
df = pd.DataFrame(data)
df[['First Name', 'Last Name']] = df['Name'].str.extract(r'(\w+)\s(\w+)')
在上述代码中,使用了正则表达式r'(\w+)\s(\w+)',该正则表达式的含义是提取出由一个或多个字母组成的字符串作为第一个子字符串,然后提取出一个空格,最后提取出由一个或多个字母组成的字符串作为第二个子字符串。
print(df)
输出结果如下:
Name Email First Name Last Name
0 John Doe john.doe@example.com John Doe
1 Jane Smith jane.smith@example.com Jane Smith
2 Mike Johnson mike.johnson@example.com Mike Johnson
在上述结果中,可以看到原始的Name列被成功提取为了两个新的列First Name和Last Name,并作为多级索引添加到了数据帧中。
推荐的腾讯云相关产品和产品介绍链接地址:
请注意,以上推荐的腾讯云产品仅供参考,具体选择应根据实际需求和情况进行。
领取专属 10元无门槛券
手把手带您无忧上云