我试图理解朴素贝叶斯和Logistic回归所需假设的差异。
据我所知,朴素贝叶斯和Logistic回归都应该具有彼此独立的特征,即预测器不应该有任何多重共线性。
并且只在Logistic回归中应遵循自变量的线性和对数赔率。
如果我错了,请纠正我,朴素回归和逻辑回归之间还有其他假设/区别吗?
发布于 2019-12-02 20:21:04
你是对的杜尔加。他们两个也有相似的表现。不同之处在于NB假设为正态分布,而logistic回归不是。至于速度,NB要快得多。
发布于 2020-01-05 05:18:13
逻辑回归,根据this source
1)要求观测值相互独立。 换句话说,观测值不应来自重复测量或匹配数据。
2)要求因变量为二元,有序逻辑回归要求因变量为序数。
3)要求自变量之间很少或没有多重共线性。 这意味着自变量之间不应该有太高的相关性。
4)假设自变量和对数赔率为线性。
5)通常需要很大的样本量。 一般的指导原则是,对于模型中的每个自变量,您至少需要10个最不频繁的结果。
发布于 2020-01-05 07:53:56
tl;dr:
朴素贝叶斯需要变量的条件独立性。回归族需要特征不是高度相关的,才能有一个可解释/很好拟合的模型。
朴素贝叶斯要求特征满足“条件独立性”要求,这意味着:

这与“回归族”的要求有很大不同。他们需要的是变量不是“相关的”。即使这些特征是相关的,回归模型可能只会变得过拟合或变得更难解释。因此,如果你使用适当的正则化,你仍然可以得到一个很好的预测。
https://stackoverflow.com/questions/59134363
复制相似问题