,可以通过以下步骤实现:
astype
方法将其转换为字符串或日期类型。str.extract
方法提取数字和日期部分,或使用str.split
方法将字符串拆分为数字和日期。astype
方法将字符串转换为数值类型,或使用pd.to_datetime
方法将字符串转换为日期类型。以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'column': ['12345-2022-01-01', '67890-2022-01-02']}
df = pd.DataFrame(data)
# 将列转换为字符串类型
df['column'] = df['column'].astype(str)
# 使用正则表达式提取数字和日期部分
df['number'] = df['column'].str.extract(r'(\d+)-')
df['date'] = df['column'].str.extract(r'-(\d{4}-\d{2}-\d{2})')
# 将数字部分转换为数值类型
df['number'] = df['number'].astype(int)
# 将日期部分转换为日期类型
df['date'] = pd.to_datetime(df['date'])
# 打印结果
print(df)
输出结果如下:
column number date
0 12345-2022-01-01 12345 2022-01-01
1 67890-2022-01-02 67890 2022-01-02
在这个例子中,我们首先将列转换为字符串类型,然后使用正则表达式提取数字和日期部分。接下来,我们将数字部分转换为数值类型,将日期部分转换为日期类型。最后,我们将提取的数字和日期部分存储在新的列中。
领取专属 10元无门槛券
手把手带您无忧上云