很少有关于分类数据的问题。需要建议/指示:
发布于 2020-04-28 09:28:04
如果分类变量是二进制变量(例如性别),则可以尝试点双列相关系数。或重新计算var水平(女性->1,男性->0),并采用pearson相关。重新编码是一种危险的方法,因为您指示顺序(woman>man)。你应该意识到这一点。
此外,测试用于确定两个分类变量之间是否存在关联(或关系)。
为了找出分类变量和数值变量之间的关联,尝试执行单向方差分析。
https://datascience.stackexchange.com/questions/73162
复制