我对R非常陌生,在网上搜索和查阅我的教科书时,我无法完全回答这个问题。
因此,我有一个按国会选区分解的人口普查数据集,我已经将其上传到R中。然而,出于我的目的,我需要每个观察值都是一个国会选区,每个人口数据点都显示为一个变量。因此,例如,不是阿拉巴马州的第一个区为E列中的每个数据点出现100次-我希望它出现一次,E列中的每个数据点都成为变量作为列。我还需要一种方法,使其适用于数据集中的其他434个地区。
这是一个粗略的示意图,它看起来像:
CD |变量|数据
AL-1 |黑人人口|10万
AL-1 |白人人口|20万
AL-1 |结婚人口75,000人
我希望它看起来像这样:
CD |黑人人口|白人人口|结婚人口
AL-1 | 100,000 | 200,000 | 75,000
有没有关于如何做到这一点的想法,或者你可以给我指给我的好的学习资源?
发布于 2016-04-12 05:57:39
下面是一个使用重塑函数的示例。正如joran指出的那样,有很多选择。
DF.long<-data.frame(state = rep(c("A","B","C","D"),each=3), type =c("XX","YY","ZZ"), value = rnorm(12))
DF.long
DF.wide<-reshape(DF.long,timevar = "type",idvar="state",direction="wide")
DF.wide
https://stackoverflow.com/questions/36559874
复制相似问题