这个问题是在之前的中提出的
首先是一些玩具数据:
df = read.table(text =
"School Year Value
A 1998 5
B 1999 10
C 2000 15
A 2000 7
B 2001 15
C 2002 20", sep = "", header = TRUE)
最初的问题是如何绘制每个学校的价值-年线。答案或多或少与下面的p1和p2相对
在r数据帧上又遇到了一个问题。
#starting position
from <- c("A","B","A","C")
to <- c("D","F","D","F")
number <- c(3,4,6,7)
data.frame(from,to,number)
如何计算两个相同的"from- to“关系(从A到D)的个数?结果应该看起来像我的“结果”数据帧。
#result
from <- c("A","
我有一个包含10,000个观察值的数据帧,并希望有一个新列,其中每一行都有相应的十进制数。十进制分布应按年分组。最好的方法是什么?
year value quartile
1 2000 2.55118169 NA
2 2000 0.79755259 NA
3 2000 0.16918905 NA
4 2001 1.73359245 NA
5 2001 0.41027113 NA
6 2001 0.73012966 NA
7 2002 -1.35901658 NA
8
我有一个包含列Items和Ranges的数据帧。 Items Ranges
0 A 30
1 A 30
2 A -10
3 B 20 我想合并重复的行并添加范围值,但只针对完全相同的行。生成的数据帧应如下所示: Ranges
Items
A 60
A -10
B 20 我尝试了df2 = df1.groupby(['Items']).sum(),得到的结果如下: Ranges
Items
我正在尝试以下函数:
stest <- data.frame(group=c("John", "Jane", "James"), mean=c(3, 5, 1))
transform(stest, group = reorder(group, mean))
并期望输出按mean排序。相反,我得到了:
group mean
1 John 3
2 Jane 5
3 James 1
也就是说,与原始数据帧中的顺序相同。
我错过了什么吗?如何通过其中一个数值变量对数据帧进行正确排序?
周围的建议都是关于使用reorder的
我有一个数据帧,我想对它进行分组(或切片)。数据帧的形式为
A B C
a b 1
a b 0
a b 1
a b 2
a b 0
a e 3
a e 3
f g 6
f g 7
f g 0
我想首先对列A和列B上的数据帧进行分组,然后,将每个分组按某个值进一步划分为具有连续行的较小分组。例如,在按列A和列B对数据帧进行分组后,每当我在列C中遇到0时,我希望在第三级上优化分组。因此,分组的数据帧如下所示
A B C
a b 1
a b 0
a b 1
a b 2
a b 0
a e 3
a e 3
f g 6
我是R的新手,但我正在取得很好的进步。除了一件事之外,我已经能够按照自己的意愿修改ggplot2 :分类标签在我的箱线图中沿着x轴绘制的顺序。我认为这只是我在如何在公式中处理数据帧范围的知识上的一个漏洞,但这里是假数据,作为一个称为df的数据帧:
Index Label Value
index1 A 1
index2 A 2
index3 A 3
index4 B 12
index5 B 11
index6 B 10
index7 C 8
index8
我有一个由420行37列组成的数据框架,这些数据来自昆虫领域的采样数据。我尝试每隔5行对列值求和,这样每5行就变成1。此外,我还尝试将数据帧($site,$date,$plot)中的非数字值“折叠”,以便它们适合由我提到的和组成的单个新行。 我试着使用这个帖子中的建议: Summing columns on every nth row of a data frame in R 包括使用包dplyr的summarize_each函数以及data.table中的gl和colSums。 我已经在我的整个数据框架上尝试了这些方法 库(data.table) setDT(FinalData),as.l
我有一个数据帧,其中包括每个时间的多行数据,并希望按时间分组,以创建一个压缩数据帧。列a和b是来自其他列的累加和,并且应该在每个时间组中保持具有最高x的行的值,而不是总和或平均值。 x time group value cumsum_A cumsum_B
1 0 A 0 0 0
2 0 B 0 0 0
3 0 A 0 0 0
4 1 A 0 0 0
5 1 B
聚类标签(在多标签分类问题中),这些标签主要出现在数据帧中?例如,我有以下数据:
text | genre
===========================
text 1 | [action,mistery,horror,thriller]
text 2 | [drama,romance]
text 3 | [comedy,drama,romance]
text 4 | [scifi,mystery,horror,thriller]
text 5 | [horror,mystery,thriller]
如何将经常出现的标记聚在一起?例如,类型“神秘”、“恐
我有一个类似这样的数据帧-例如,2列多行:
A 2
A 7
B 1
B 3
B 6
C 2
我想在第一列的每个唯一值中对第二列中的项执行一些操作。
我有过
unique.values <- sort(unique(mydata[,1]))
这部分用于获取每个唯一值,但我不知道如何将每个唯一因子与它在第二列中的值相关联。我需要能够完全独立地操作每一个,并希望能够计数行等。尝试使用grep,但不能做到这一点。
感谢您能提供的任何帮助!
我有一个像这样的数据文件:
id <- c(1,1,1,2,2,2,3,3,3,4,4,4)
value <- c(2,3,3,4,2,2,4,4,3,2,2,3)
df <- data.frame(id, value)
我现在要做的是编译第一个it (1和2)的两个数据帧,并在其上编译一个计算。I希望在接下来的两个数据帧( id 3和4)上移动,并对所有行执行一个计算( etc...And this )。因此,psuedo代码看起来如下:
#loop over dataframe
for i in 1:nrow(df) {
#fetch the rows of th