从pandas DataFrame中的列中剥离文本可以使用字符串处理方法和正则表达式来实现。以下是一种常见的方法:
下面是一个示例代码,演示如何从pandas DataFrame中的列中剥离文本:
import pandas as pd
import re
# 创建一个示例DataFrame
data = {'Name': ['John Smith', 'Jane Doe', 'Mike Johnson'],
'Age': [30, 25, 35],
'Email': ['john@example.com', 'jane@example.com', 'mike@example.com']}
df = pd.DataFrame(data)
# 使用字符串处理方法剥离文本
df['First Name'] = df['Name'].str.split().str[0]
df['Last Name'] = df['Name'].str.split().str[1]
# 使用正则表达式剥离文本
df['Domain'] = df['Email'].apply(lambda x: re.findall(r'@([\w.]+)', x)[0])
# 打印结果
print(df)
输出结果如下:
Name Age Email First Name Last Name Domain
0 John Smith 30 john@example.com John Smith example.com
1 Jane Doe 25 jane@example.com Jane Doe example.com
2 Mike Johnson 35 mike@example.com Mike Johnson example.com
在上述示例中,我们使用了split()方法和正则表达式来从Name列和Email列中剥离文本,并将结果存储在新的列中。请注意,这只是一种示例方法,具体的处理方式可以根据实际需求进行调整。
推荐的腾讯云相关产品:腾讯云云服务器(CVM)、腾讯云数据库MySQL(CDB)、腾讯云对象存储(COS)等。你可以通过访问腾讯云官方网站获取更多关于这些产品的详细信息和介绍。
领取专属 10元无门槛券
手把手带您无忧上云