将DF变量转换为不在df中的多个字符串变量,可以使用pandas库中的get_dummies()
函数来实现。get_dummies()
函数可以将指定的列转换为多个虚拟变量,并将其添加到原始数据框中。
下面是一个示例代码:
import pandas as pd
# 创建一个包含分类变量的数据框
df = pd.DataFrame({'category': ['A', 'B', 'C', 'A', 'B', 'C']})
# 使用get_dummies()函数将分类变量转换为虚拟变量
dummies = pd.get_dummies(df['category'])
# 将虚拟变量添加到原始数据框中
df = pd.concat([df, dummies], axis=1)
# 打印转换后的数据框
print(df)
运行以上代码,将会输出如下结果:
category A B C
0 A 1 0 0
1 B 0 1 0
2 C 0 0 1
3 A 1 0 0
4 B 0 1 0
5 C 0 0 1
在这个示例中,原始数据框df
包含一个名为category
的分类变量列。通过调用get_dummies()
函数,将category
列转换为三个虚拟变量列A
、B
和C
。然后,使用pd.concat()
函数将虚拟变量列添加到原始数据框中,得到转换后的数据框df
。
这种转换可以帮助我们在机器学习等任务中处理分类变量。例如,可以将分类变量转换为数值型变量,以便在模型训练中使用。
领取专属 10元无门槛券
手把手带您无忧上云