我有一个包含连续变量和分类变量的数据集。最后,我想建立一个logistic回归模型来计算响应二分变量的概率。
将对数线性模型应用于模型中的分类变量以测试它们的交互作用,然后使用指定的交互作用作为logistic模型中的预测值,这是可接受的吗,甚至是一个好主意?
R中的示例:
df中的列: CategoricalA、CategoricalB、CategoricalC、CategoricalD、CategoricalE、ContinuousA、ContinuousB、ResponseA
library(MASS)
#Isolate categorical variables in new dat