,可以使用pandas库中的函数进行操作。具体步骤如下:
import pandas as pd
# 读取数据集
df = pd.read_csv('data.csv')
# 将一列分成多个变量
new_cols = df['column_name'].str.split(expand=True)
其中,'column_name'是要分割的列名,expand=True表示将分割后的结果扩展为多个列。
# 合并分割后的变量与原始数据集
df = pd.concat([df, new_cols], axis=1)
这里使用了pandas的concat函数,将分割后的变量与原始数据集按列进行合并。
# 重命名新生成的变量
df.rename(columns={0: 'new_col1', 1: 'new_col2', ...}, inplace=True)
# 删除原始列
df.drop('column_name', axis=1, inplace=True)
通过rename函数可以对新生成的变量进行重命名,使用drop函数可以删除原始列。
这样,就将一列分成多个变量并使df变长了。
注意:以上代码中的'data.csv'、'column_name'、'new_col1'、'new_col2'等需要根据实际情况进行替换。
领取专属 10元无门槛券
手把手带您无忧上云