R将数据集转换为长格式的复杂版本(id信息分布在多个不同的行中)

R将数据集转换为长格式的复杂版本(id信息分布在多个不同的行中)是指将数据集从宽格式转换为长格式，其中id信息分布在多个不同的行中。这种转换通常用于数据分析和可视化的需要。

在R中，可以使用tidyverse包中的tidyr库来实现这种转换。tidyr库提供了一些函数来处理数据集的重塑和转换操作，其中最常用的函数是gather()和spread()。

具体步骤如下：

安装和加载tidyverse包：

install.packages("tidyverse")
library(tidyverse)

创建一个示例数据集：

假设我们有一个数据集df，其中包含了id信息分布在多个不同的行中：

df <- data.frame(id = c(1, 2),
                 name = c("Alice", "Bob"),
                 age_2019 = c(25, 30),
                 age_2020 = c(26, 31),
                 salary_2019 = c(50000, 60000),
                 salary_2020 = c(55000, 65000))

使用gather()函数将数据集转换为长格式：

df_long <- df %>% gather(key = "year_salary", value = "value", -id, -name)

在上述代码中，我们使用gather()函数将除了id和name列之外的所有列转换为两列：year_salary和value。其中，year_salary列包含了原始数据集中的列名，value列包含了对应列的值。

对转换后的数据集进行进一步处理：

根据具体需求，我们可以使用dplyr库中的函数对转换后的数据集进行进一步处理和分析。例如，可以使用filter()函数筛选特定条件的数据行，使用mutate()函数添加新的计算列，使用group_by()函数进行分组汇总等。

df_filtered <- df_long %>% filter(grepl("age", year_salary))
df_summary <- df_long %>% group_by(year_salary) %>% summarise(mean_value = mean(value))

在上述代码中，我们使用filter()函数筛选出year_salary列中包含"age"的数据行，使用group_by()函数对year_salary列进行分组，然后使用summarise()函数计算每个分组的平均值。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云提供了一系列云计算相关的产品和服务，以下是一些推荐的产品和对应的介绍链接地址：

云服务器（CVM）：提供弹性计算能力，支持多种操作系统和应用场景。产品介绍链接
云数据库MySQL版（CDB）：提供高可用、可扩展的MySQL数据库服务。产品介绍链接
云存储（COS）：提供安全、可靠、低成本的对象存储服务。产品介绍链接
人工智能平台（AI Lab）：提供丰富的人工智能开发工具和服务，包括图像识别、语音识别、自然语言处理等。产品介绍链接

请注意，以上推荐的产品和链接仅供参考，具体选择和使用需根据实际需求和情况进行。

R将数据集转换为长格式的复杂版本(id信息分布在多个不同的行中)

、

我有学生注册数据，目前组织如下： df <- tibble(course_number = c("Snow", 12345, 56789, "Stark", 10111, 21314, 15161),academic_level = c("John", "UG", "UG", "Arya", "GR", "GR", "GR"), course_i

浏览 13提问于2020-01-14得票数 1

回答已采纳

2回答

在ggplot2中显示多个数据帧

、、、、

我正试图用x = index、y = values在一行图中分层多个数据帧。我使用的8 data.frames格式(索引和值)是几百行长的：2306 0.000000由于数据帧并不都具有相同的大小，所以我还试图通过将数据集转换为百分比(索引/值总数)*100

浏览 4提问于2016-07-28得票数 0

回答已采纳

1回答

是否有任何修改/另一个函数来绘制两个数值变量与一个字符串变量的关系？

我有一个这样的数据集:突变的名称和表示两个条件(CIP和TIG)中的值的两个数值变量：我能够使用以下代码绘制这些变异中的一个变量(例如CIP)：数据名称为“Dotchart2” labels = rownames((Dotchart2)), pch = 16, cex = 1, pt.cex = 2) 因为我比较的</

浏览 0提问于2020-07-01得票数 0

2回答

在R中，如何将带有单个逗号分隔字段的一条记录转换为多条记录？

我在R工作。strsplit可以将条目拆分成一个值向量，但是如何使新记录包

浏览 2提问于2011-05-04得票数 1

1回答

如何用csv、excel等人类可读的格式保存xarray？

我对xarray数据结构很陌生。我有xarrary数据变量(intensity_table)，它在图像中如下所示。这种结构来源于tif图像的后处理。tif图像有6个圆周和3个通道。Intensity_table计算这些图像的归一化强度，并将其保存在特征中。我想单独看到每个图像的这个特征变量。是否有任何方法来读取这些数据的简单格式或保存在文本文件，以便我可以从任何地方读取。

浏览 4提问于2022-05-03得票数 0

2回答

在R中保留dcast中的变量

我在R中使用dcast函数将长格式数据集转换为宽格式数据集。我有一个ID数，一个分类变量(CAT)和一个连续变量(AMT)。但是，我还有一个变量SEX，它对于给定ID编号的所有行都是相同的。这段代码可以创建宽格式的数据集，但我丢失了SEX。我怎样才能保留它呢

浏览 2提问于2014-12-16得票数 2

1回答

将带有计数的宽数据帧转换为R中的长格式

我正在努力将数据转换成长格式。在R中，我有以下数据：present <- c(48,38,5,1,0)3 1.5 5 788 5 7.0 0 37 我希望将</e

浏览 4提问于2020-02-12得票数 2

回答已采纳

2回答

如何将列数据转换为列名？

、、、、

我得到了一个光谱参考数据库，它与我正在使用的样本数据集非常不同。在我的数据中，0或1表示是否存在峰值，而在参考数据库中，峰值位置被列为行值，并根据肽数据(我不需要)分组为一列。0 1 1尽管引用数据库看起来非常糟糕(请注意每列的多个</em

浏览 6提问于2021-04-23得票数 2

回答已采纳

2回答

R中列的行值

、

我是新的R，我正在尝试建立我的第一个回归模型。然而，我正在努力转换我的数据。我的数据按以下格式组织：1 25 1 3 0.4 0.1526 1 1 0.4 0 0 0 1 26 2 3 0.4

浏览 3提问于2020-02-12得票数 1

回答已采纳

5回答

用Python将数值数据快速转换为固定宽度的格式文件

、、

将仅保存数字数据的记录转换为格式字符串并将其写入Python文件的最快方法是什么？例如，假设record是一个包含属性id、x、y和wt的对象的庞大列表，我们经常需要将它们刷新到外部文件中。%11.5e %7.5f\n" % (r.id, r.x, r.y, r.wt)) 然而，我的代码花费了太多<e

浏览 2提问于2009-12-06得票数 3

4回答

使用Hadoop处理来自多个数据源的数据

、、

mapreduce和任何其他hadoop技术(HBase、Hive、pig等)是否适合于有多个输入文件以及需要在不同数据源之间比较数据的情况。但是，这些任务非常简单，因为它们只涉及操作单个数据集。我们现在的需求要求我们从多个源读取数据，并对另一个数据源上的各种数据元素执行比较。然后，我们将报告这些差异。我们正在处理的数据

浏览 0提问于2012-05-31得票数 1

1回答

使用列名信息在R中将宽数据帧重塑为长格式

、、、、

我在将复杂的数据库输出从宽格式转换为长格式时遇到了困难。它有几百行和1,000列。看起来是这样的：问题是df1_long的变量或df1_wide的列包含我想要选择的信息。所以我更想要这样的东西： ID part task subgroup type

浏览 3提问于2013-08-15得票数 0

回答已采纳

4回答

Eclipse格式化程序:在注解后换行/public？

、

IntelliJ有一些这样的设施和选项。例如，我希望它的格式如下：void foo()更好的是能够缩进注释和可见性，如下所示void fooEclipse中是否存在这样的格式化选项？

浏览 0提问于2012-06-07得票数 4

1回答

熊猫数据栏(多列但非全部列)从长到宽的转换

、、、、

问题：我需要将长类型格式转换为宽类型格式，这样每个公司都将显示在一<

浏览 2提问于2020-02-08得票数 1

3回答

如何下载SVN仓库？

下载整个Subversion存储库，即存储库本身的命令是什么？我知道它不是svn checkout，因为它只下载head版本。我正在寻找类似于git clone或hg clone的东西。

浏览 0提问于2013-01-07得票数 1

2回答

将数据从长到宽转置

、

我正在尝试将SAS中的数据从长格式转换为宽格式。我遇到的问题是，我有多个要转置的列。下面我有几个示例数据集来演示我想要做的事情。我正在处理的实际数据集将非常大，我认为处理这一问题的一种方法是转换单独的列，然后在</

浏览 2提问于2018-09-19得票数 0

1回答

使用NA将数据跨值从长到宽进行格式化

、、

我正在使用NA值将r dataframe从长格式转换为宽格式。并尝试添加执行“跳过”NA值的操作的新行。我可以使用spread()，但最终希望对多年收集的每个度量执行操作。在下面的示例中，这可能包含两个或更多个值。1 2 NA3 3 1 NA 3 4 4 1 5

浏览 19提问于2018-12-29得票数 0

2回答

矩阵RDLC中的内存异常

、

我正在编写RDLC报告，其中Im使用矩阵显示数据。我试图载入的记录大约是80,000 records.Do，有人面临同样的问题吗？

浏览 4提问于2012-11-27得票数 2

3回答

删除在R中没有选择其他选项的选择集的所有行

、、

我正在为数据管理所需的一些代码而挣扎。我事先道歉，因为我相信它有一个相当简单的解决办法，但我在其他地方找不到任何信息。我正在使用R中的mlogit命令以长格式分析数据，对于每个选择集，应该选择一个选项；否则mlogit命令将失败，出现以下错误：missing value where TRUE&#x

浏览 1提问于2015-12-24得票数 1

回答已采纳

2回答

将记录集作为Oracle的HTML返回

、、、

我有一个Oracle数据库，需要根据我的Dot Net web应用程序中发生的事件发送电子邮件通知。电子邮件通知采用HTML格式。我有不同的模板，用于根据电子邮件通知，是要生成的。因此，当事件被调用时，我将一个Id传递给处理程序，然后它调用一个存储过程。然后，我获得了HTML格式的电子邮件模板，其中的标记将被存储过程中的字段替换。然后，我搜索模板

浏览 1提问于2011-06-09得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R将数据集转换为长格式的复杂版本(id信息分布在多个不同的行中)

相关·内容

R将数据集转换为长格式的复杂版本(id信息分布在多个不同的行中)

在ggplot2中显示多个数据帧

是否有任何修改/另一个函数来绘制两个数值变量与一个字符串变量的关系？

在R中，如何将带有单个逗号分隔字段的一条记录转换为多条记录？

如何用csv、excel等人类可读的格式保存xarray？

在R中保留dcast中的变量

将带有计数的宽数据帧转换为R中的长格式

如何将列数据转换为列名？

R中列的行值

用Python将数值数据快速转换为固定宽度的格式文件

使用Hadoop处理来自多个数据源的数据

使用列名信息在R中将宽数据帧重塑为长格式

Eclipse格式化程序:在注解后换行/public？

熊猫数据栏(多列但非全部列)从长到宽的转换

如何下载SVN仓库？

将数据从长到宽转置

使用NA将数据跨值从长到宽进行格式化

矩阵RDLC中的内存异常

删除在R中没有选择其他选项的选择集的所有行

将记录集作为Oracle的HTML返回

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐