我刚刚从R开始,学习使用csv文件的方法
样本数据集
Org_Name Question# Response(scales from 1 through 5)
Org1 1 1
Org1 2 3
Org1 3 5
Org2 1 4
Org2 2 2
Org2 3 3
Org3 1 4
Org3 2 1
Org3 3 5
我想弄清楚如何用R做一些数据分析。
所以我要问你们的是
发布于 2015-05-14 19:29:19
1) R是处理CSV数据的一个很好的工具。几分钟后,您就可以下载RStudio并启动并运行。
下面是一些示例代码,它向您展示了如何开始:
sample <- data.frame(Org_Name = c(rep("Org1", 3), rep("Org2", 3), rep("Org3", 3)),
Question = c(1,2,3,1,2,3,1,2,3),
Response = c(1,3,5,4,2,3,4,1,5))
2)这定义了一个名为sample
的数据框架,并将数据分配给它。要查找所有在问题2中得分为4分或更高的Orgs,您可以使用以下方法:
> sample$Org_Name[sample$Response >= 4 & sample$Question == 2]
factor(0)
这将返回factor(0)
,这意味着没有任何Orgs匹配。但是,如果您想知道哪一个Orgs对问题2的答复很低,可以尝试:
> sample$Org_Name[sample$Response <= 2 & sample$Question == 2]
[1] Org2 Org3
3)谷歌是寻找R资源的好地方。官方的R文档也很好。
发布于 2020-03-20 20:26:27
如果你是初学者,下载一些软件包将对你有很大的帮助。下面是使用dplyr
包回答问题的一些示例代码:
1) R是任何数据操作或分析的好工具,读取csv文件非常容易:
dat <- read.csv ("path")
2)当您将csv文件读入一个对象中(如上面的"dat“)后,dplyr
包有很多函数可以执行几乎任何操作,例如,您的问题是”检查Question#2中哪些Org名称得分较高(4-5),Question#1中哪些Org名称得分较低(1-2)“。这将为您提供满足指定条件的Org_Names:
dat %>%
filter (Question2 >= 4 & Question1 <= 2) %>% select (Org_Name)
我猜你每隔多长时间要数一次?
dat %>%
filter (Question2 >= 4 & Question1 <= 2) %>% select (Org_Name) %>% nrow()
https://stackoverflow.com/questions/30250959
复制相似问题