首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用mutate_at将R中缺少的值替换为从列名称获取的值(如果不缺少

使用mutate_at函数可以将R中缺少的值替换为从列名称获取的值。mutate_at函数是dplyr包中的一个函数,用于对指定的列进行变换操作。

具体步骤如下:

  1. 导入dplyr包:首先需要导入dplyr包,可以使用以下代码进行导入:
代码语言:txt
复制
library(dplyr)
  1. 读取数据:将需要处理的数据读入R中,可以使用read.csv()或read.table()等函数进行读取。
  2. 使用mutate_at函数进行替换:使用mutate_at函数对指定的列进行替换操作。该函数的第一个参数是数据集,后面的参数是需要进行操作的列名。可以使用vars()函数指定需要操作的列,也可以使用starts_with()、ends_with()、contains()等函数进行模糊匹配。

下面是一个示例代码,假设有一个数据集df,其中包含了三列A、B、C,其中部分值缺失:

代码语言:txt
复制
df <- data.frame(A = c(1, NA, 3), B = c(NA, 2, NA), C = c(NA, NA, 3))
df <- df %>% mutate_at(vars(A:C), ~ifelse(is.na(.), get(colnames(df)), .))

在上述代码中,使用了mutate_at函数对列A、B、C进行操作。使用了ifelse函数判断每个值是否为缺失值,如果是缺失值,则使用get(colnames(df))获取对应列的名称作为替换值。

这样,就可以将R中缺少的值替换为从列名称获取的值。

推荐的腾讯云相关产品和产品介绍链接地址:

  • 云服务器(CVM):提供弹性计算能力,满足各种业务需求。产品介绍链接
  • 云数据库 MySQL版(CDB):提供高性能、高可用的MySQL数据库服务。产品介绍链接
  • 云原生容器服务(TKE):提供高度可扩展的容器化应用管理平台。产品介绍链接
  • 云存储(COS):提供安全、稳定、低成本的对象存储服务。产品介绍链接
  • 人工智能机器学习平台(AI Lab):提供丰富的人工智能开发工具和资源,支持机器学习、深度学习等任务。产品介绍链接

请注意,以上链接仅供参考,具体选择产品时需要根据实际需求进行评估和选择。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

R语言第二章数据处理⑤数据框转化和计算目录正文

正文 本篇描述了如何计算R数据框并将其添加到数据框。一般使用dplyr R以下R函数: Mutate():计算新变量并将其添加到数据表。 它保留了现有的变量。...同时还有mutate()和transmutate()三个变体来一次修改多个: Mutate_all()/ transmutate_all():函数应用于数据框每个。...Mutate_at()/ transmutate_at():函数应用于使用字符向量选择特定 Mutate_if()/ transmutate_if():函数应用于使用返回TRUE谓词函数选择...转换特定 mutate_at():转换按名称选择特定: my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),...mutate_if()对于变量从一种类型转换为另一种类型特别有用。

4.1K20
  • Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

    这篇文章很大一部分内容涉及FF网站导入数据,并对其进行整理,以用于我们投资组合收益。我们看到,处理数据在概念上很容易理解,但在实际操作却很耗时。...数据被打包为 zip 文件,所以需要做不仅仅是调用 read_csv()。使用tempfile() 基础 R 函数来创建一个名为 temp. 这是我们放置压缩文件地方。...如果我们导入不同 FF 因子集,我们需要指定不同列名。 作为一种替代方法,下面的代码块在导入后换为数字,但更通用。它可以应用于其他 FF 因子集合。...还将FF数据转换为十进制,并创建了一个名为R\_excess,保存高于无风险利率收益。...conf.high 和 conf.low 来保存我们置信区间最小和最大

    3.8K30

    Numpy 修炼之道 (12)—— genfromtxt函数

    字段名称使用names关键字定义。 当dtype=None时,每个类型其数据迭代确定。...在以下示例,转换器convert剥离字符串转换为相应浮点型或如果字符串为空,转换为-999。...使用 missing 和 filling values 在我们尝试导入数据集中可能会丢失某些条目。在前面的示例,我们使用转换器空字符串转换为浮点数。...我们可以使用特殊键None为所有定义默认。 在下面的例子,我们假设缺少在第一中用"N/A"标记,"???"在第三。...我们希望这些缺失换为0,如果它们出现在第一和第二,则转换为-999,如果它们出现在最后一: >>> data = "N/A, 2, 3\n4, ,???"

    9.7K40

    独家 | 用于数据清理顶级R包(附资源)

    纠正错误 R有许多预先构建方法来纠正数据错误,例如转换,就像在Excel或SQL那样,使用简单逻辑,例如as.charater()换为字符串。...例如,此函数完全消除所选数据缺少。 Na.omit(YOUR_DATA_COLUMN) 有类似的选项可以用0或N / A替换空白,具体取决于字段类型,并提高数据集一致性。...名称 考试A 考试B 约翰 55 80 麦克 76 90 山姆 45 75 gather收集功能通过将其转换为可用来完成。...这个函数允许你在R studio编写SQL代码来选择你数据元素 Janitor包 该软件包能够通过多个查找重复项,并轻松地数据框创建友好。...splitstackshape包 这是一个较旧包,可以使用数据框逗号分隔。用于调查或文本分析准备。 R拥有大量软件包,本文只是触及了它可以做事情表面。

    1.4K21

    MR应知应会:MungeSumstats包

    该软件包还使用户能够灵活地重新格式化文件导出为制表符分隔 VCF 或 R 本机对象,例如 data.table、GRanges 或 VRanges 对象。...小 p 超过 R 限制,可能会导致 LDSC/MAGMA 出现错误,应进行转换。默认为 TRUE。 convert_large_p p >1 是否转换为 1?...如果不需要过滤,则使用 NULL。默认为 X、Y 和线粒体。 rmv_chrPrefix 控制是否染色体名称删除“chr”/“CHR”(默认为 TRUE)。...任何不在参考基因组上 SNP 将使用染色体和碱基对位置数据参考基因组(如果可能)进行校正。...但是,如果 youf 文件标题丢失,我们提供映射不正确,您可以提供自己映射文件。必须是 2 数据框,列名称为“未更正”和“已更正”。

    2.2K11

    Java注解之@PathVariable

    是的,@PathVariable 注解和 @RequestParam 注解可以同时在同一个方法参数上使用。这允许您同时路径变量和查询参数获取请求参数。...这样如果 URL 缺少路径变量 id,将会接收 null ,并可以在方法处理缺少路径变量情况。 需要注意是, required 属性设置为 false 可能会导致安全问题。...5、一旦选择了合适类型转换器,Spring MVC 将使用它来路径变量字符串表示形式转换为方法参数目标类型。如果转换成功,方法参数将以转换后传递给控制器方法。...总之,Spring MVC 使用默认类型转换器或自定义类型转换器来 URL 路径变量字符串表示形式转换为方法参数目标类型。这样可以方便地 URL 中提取参数并在控制器方法中使用。...例如,如果请求URL为"/users/123",则Spring MVC将从URL路径获取"userId"变量(即"123"),并尝试将其转换为int类型。

    18910

    Python—关于Pandas缺失问题(国内唯一)

    旧版数据库手动传输时,数据丢失。 发生编程错误。 用户选择填写字段。 其中一些来源只是简单随机错误。在其他时候,可能会有更深层原因导致数据丢失。...稍后我们将使用它来重命名一些缺失。 导入库后,我们csv文件读取到Pandas数据框使用该方法,我们可以轻松看到前几行。...(使用.head()方法) 名称推断出以下字符组非常容易: ST_NUM:街道号码 ST_NAME:街道名称 OWN_OCCUPIED:住所所有人是否被占用 NUM_BEDROOMS:卧室数 我们还可以进行设置...遍历OWN_OCCUPIED 尝试条目转换为整数 如果条目可以更改为整数,请输入缺失 如果数字不能是整数,我们知道它是一个字符串,所以继续 看一下代码,然后我将对其进行详细介绍 # 检测数据 cnt...要尝试条目更改为整数,我们使用。int(row) 如果可以值更改为整数,则可以使用Numpy's条目更改为缺少。np.nan 另一方面,如果不能将其更改为整数,我们pass继续。

    3.2K40

    sparksql源码系列 | 生成resolved logical plan解析规则整理

    AddMetadataColumns Resolution fixedPoint 当节点缺少已解析属性时,元数据添加到子关系输出。...除非此规则将元数据添加到关系输出,否则analyzer检测到没有任何内容生成。此规则仅在节点已解析但缺少来自其子节点输入时添加元数据。这可以确保元数据不会添加到计划,除非使用它们。...如果名称重复,则使用最内部作用域中定义名称。...关于减法:1.如果两边都是间隔,保持不变;2.否则,如果左侧为日期,右侧为间隔,则将其转换为DateAddInterval(l, -r);3.否则,如果右侧是区间,则将其转换为TimeAdd(l, -r...例如,如果实际数据类型为Decimal(30,0),编码器不应将输入换为Decimal(38,18)。然后,解析编码器将用于internal row反序列化为Scala

    3.7K40

    R语言缺失处理:线性回归模型插补

    p=14528 ​ 在当我们缺少时,系统会告诉我用-1代,然后添加一个指示符,该变量等于-1。这样就可以不删除变量或观测。...---- 视频 缺失处理:线性回归模型插补 ---- 我们在这里模拟数据,然后根据模型生成数据。未定义换为NA。一般建议是缺失换为-1,然后拟合未定义模型。...如果未定义50%,则缺少数据,删除一半行 n=1000 x1=runif(n) x2=runif(n) e=rnorm(n,.2) y=1+2*x1-x2+e alpha=.05 indice=sample...,我们获得与第一种方法完全相同,该方法包括删除缺少行。...5.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析 6.使用SAS,Stata,HLM,R,SPSS和Mplus分层线性模型HLM 7.R语言中岭回归、套索回归、主成分回归:线性模型选择和正则化

    3.5K11

    python数据分析之清洗数据:缺失处理

    使用python进行数据分析时,如果数据集中出现缺失、空、异常值,那么数据清洗就是尤为重要一步,本文重点讲解如何利用python处理缺失 创建数据 为了方便理解,我们先创建一组带有缺失简单数据用于讲解...或者使用data.info()来检查所有数据 ? 可以看到一共有7行,但是有两非空都不到7行 缺失处理 一种常见办法是用单词或符号填充缺少。例如,丢失数据替换为'*'。...我们可以使用.fillna('*') 所有缺失换为* ? 当然也可以针对某一缺失进行填充,比如选择score进行填充 ? 还有一种办法是将其替换为平均值。...如果是数字,则可以包括均值;如果是字符串,则可以选择众数。比如可以score缺失填充为该均值 ? 当然也可以使用函数来填写数字缺失。比如取数据框缺失上下数字平均值。 ?...使用数据为之前文章使用NBA数据(可以查看早起python历史文章获取数据与更多分析),我们先导入数据并检查缺失 ?

    2K20

    R数据科学|第八章内容介绍

    使用readr进行数据导入 本文介绍如何使用readr包平面文件加载到 R ,readr 也是 tidyverse 核心 R包之一。...如果为FALSE,将自动生成列名:X1, X2, X3等。如果col_names是一个字符向量,这些将被用作名称,并且输入第一行将被读入输出数据帧第一行。...默认区域设置是以美国为中心(如R),但您可以使用locale()创建自己区域设置,控制默认时区、编码、十进制标记、大标记和日/月名称等内容。 na 字符串字符向量,解释为缺少。...quoted_na 是否引号内缺少应该被视为缺少(默认)或字符串 comment 用于标识注释字符串 trim_ws 在解析每个字段之前,是否应该修剪其前导和尾随空格?...guess_max 用于猜测类型最大记录数 progress 显示进度条 skip_empty_rows 是否忽略空白行 如果能够熟练使用read_csv()函数,就能同样使用readr包其他函数来读取文件了

    2.2K40

    .NET 可移植性分析器

    项目转换为面向 .NET Core 等新平台后,可以使用基于 Roslyn API 分析器工具来识别引发 PlatformNotSupportedException 异常以及其他兼容性问题 API...可并行安装意味着无需破坏其他应用即可采用新 .NET Core 版本。 如果目标是应用移植到 .NET Core 以支持多个平台,则建议使用此对象。...如果使用是 ApiPort 控制台应用,.NET 可移植性报表将以指定格式保存为文件。 默认位于当前目录 Excel 文件 (.xlsx) 。...目标类型:该类型具有目标平台缺少 API 目标成员:目标平台缺少方法 程序集名称缺少 API 所在 .NET Framework 程序集。...每个选定目标平台都是一,例如“.NET Core”:“不支持”表示此目标平台不支持 API。 建议更改:要进行更改推荐 API 或技术。 对于许多 API,此字段当前为空或已过时。

    1.2K40

    30 个小例子帮你快速掌握Pandas

    我们删除了4,因此列数14减少到10。 2.读取时选择特定 我们只打算读取csv文件某些。读取时,列表传递给usecols参数。如果您事先知道列名,则比以后删除更好。...8.删除缺失 处理缺失另一种方法是删除它们。“已退出”缺少。以下代码删除缺少任何行。...第一个参数是位置索引,第二个参数是名称,第三个参数是。 19.where函数 它用于根据条件替换行或。默认替换是NaN,但我们也可以指定要替换。...符合指定条件保持不变,而其他换为指定。 20.排名函数 它为这些分配一个等级。让我们创建一个根据客户余额对客户进行排名。...29.根据字符串过滤 我们可能需要根据文本数据(例如客户名称)过滤观察结果(行)。我已经虚构名称添加到df_new DataFrame。 ? 让我们选择客户名称以Mi开头行。

    10.7K10

    python数据处理 tips

    df.head()显示数据帧前5行,使用此函数可以快速浏览数据集。 删除未使用 根据我们样本,有一个无效/空Unnamed:13我们不需要。我们可以使用下面的函数删除它。...注意:请确保映射中包含默认male和female,否则在执行映射后它将变为nan。 处理空数据 ? 此列缺少3个:-、na和NaN。pandas承认-和na为空。...解决方案1:删除样本(行)/特征(如果我们确信丢失数据是无用,或者丢失数据只是数据一小部分,那么我们可以删除包含丢失行。 在统计学,这种方法称为删除,它是一种处理缺失数据方法。...在该方法如果缺少任何单个,则整个记录将从分析中排除。 如果我们确信这个特征()不能提供有用信息或者缺少百分比很高,我们可以删除整个。...在这种情况下,让我们使用中位数来替换缺少。 ? df["Age"].median用于计算数据中位数,而fillna用于中位数替换缺失

    4.4K30

    Oracle 错误总结及问题解决 ORA「建议收藏」

    ORA-01151: 如果需要,请使用介质恢复以恢复块和恢复备份 ORA-01152: 文件 没有完备旧备份恢复 ORA-01153: 激活了兼容介质恢复 ORA-01154: 数据库正在运行...ORA-01410: 无效 ROWID 说明:当字符转变为ROWID时,如果使用了无效字符串,会触发此异常。...类型 ORA-13266: 数据插入表 时出错 ORA-13267: 层次表 读取数据时出错 ORA-13268: USER_SDO_GEOM_METADATA 获取维时出错 ORA-13269...:更新分区关键字导致分区更改 说明:在更新记录Partition Key时,如果不开启ROW MOVEMENT,则会报此错误。...-19717: 对于非 OMF 搜索, 必须指定模式 ORA-19718: 命令 ID 长度大于 ORA-19719: 操作名称长度大于 ORA-19720: OCI 号转换为 SCN 时出错

    21.5K20

    基于 mlr 包逻辑回归算法介绍与实践(上)

    新画作整个分类过程 通过使用算法学习得到线性模型,新数据铜含量(copper)和铅含量(lead)转换为它们 log odds (或 logits)。...mutate_at(.vars = fctrs, .funs = factor) %>% #变量转换为因子 mutate(FamSize = SibSp + Parch) %>% #定义新变量...gather() 函数数据转化为 untidy 形式:每个预测变量名保存在一,它们保存在另一。...此时报错,查看年龄数据可知存在缺失,而逻辑回归无法处理这样数据。 2.5 处理缺失 处理缺失数据有两种方法: 简单地分析中排除缺少数据情况。 应用一种机制来填补空白。...在本例,由于年龄缺失较多,故使用第二种处理缺失方法。

    2.3K20

    Pandas 秘籍:1~5

    序列视觉输出风格比数据帧少。 它代表一数据。 连同索引和一起,输出显示序列名称,长度和数据类型。 或者,虽然建议这样做,但可能会出错,但是可以使用带有列名作为属性点表示法来访问数据。...我们通过观察count方法结果与size属性匹配,确定该序列缺少。...当像上一步那样数字彼此相加时,pandas 缺失默认为零。 但是,如果缺少特定行所有,则 Pandas 也会将总数也保留为丢失。...如果仔细观察,您会发现步骤 3 输出缺少步骤 2 所有对象。其原因是对象缺少,而 pandas 不知道如何处理字符串与缺失。 它会静默删除无法为其计算最小所有。...duration列缺少一些如果回头看步骤 1 数据帧输出,您将看到最后一行缺少duration。 为此,步骤 2 布尔条件返回False。

    37.5K10

    R」dplyr 列式计算

    ❝在近期使用 「dplyr」 进行多选择性操作,如 mutate_at() 时,发现文档提示一系列 「dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们统一替代品,所以最近抽时间针对性学习和翻译下...,但目前我们还没找到解决方案) 当前列 如果需要,你可以通过调用 cur_column() 来获取当前列名字。...这是由 base R 提供,但它并没有很好文档,我们花了一段时间才发现它是有用,而不仅仅是理论上好奇。 我们可以使用数据框让汇总函数返回多。...我们可以使用没有外部名称作为数据框解包为单独约定。 你如何转移已经存在代码?...幸运是,已有的代码转换为使用 across() 实现通常是非常直观: 去掉函数 _if(), _at() and _all() 后缀 调用 across(),第一个参数如下: 后面如果还有参数,保持原样即可

    2.4K10
    领券