函数在现有数据帧中创建新的二进制变量,可以通过以下步骤实现:
df['new_variable'] = ...
来创建一个新的列,并将其命名为"new_variable"。举例来说,假设我们有一个数据帧df,其中包含了一个名为"age"的列,我们想要创建一个新的二进制变量"is_adult"来表示是否成年人。可以按照以下步骤进行操作:
import pandas as pd
# 创建数据帧
df = pd.DataFrame({'age': [18, 25, 30, 12, 40]})
# 创建新的二进制变量
df['is_adult'] = df['age'].apply(lambda x: 1 if x >= 18 else 0)
# 验证结果
print(df)
输出结果为:
age is_adult
0 18 1
1 25 1
2 30 1
3 12 0
4 40 1
在这个例子中,我们根据"age"列的值是否大于等于18来判断是否成年,如果满足条件则将"is_adult"列的值设置为1,否则设置为0。最后,我们可以看到新的二进制变量成功地创建并添加到了数据帧中。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云