我有一个带有二进制变量"df_customers“的数据。在这个专栏中,1.5%的人失踪了,他们是NA。其中男性占60.81%,女性占60.81%。
我将这些比例赋值为males_impute和females_impute:
# PROPORTION OF NAs IN VARIABLE SEX
customer_NAs <- nrow(filter(df_customers, is.na(sex)))
# IMPUTATION PROPORTIONS OF MALE / FEMALE ACC. TO COMPLETE VALUES
males_impute <- (