在r/sparklyr中,可以使用dplyr
包中的select_if
函数结合is.na
函数来提取数据集中没有任何空值的列名。
具体步骤如下:
dplyr
和sparklyr
包:library(dplyr)
library(sparklyr)
sc <- spark_connect(master = "local")
df
:df <- spark_read_csv(sc, "df", "path/to/dataset.csv")
select_if
函数和is.na
函数来提取没有空值的列名:non_null_cols <- df %>%
select_if(~!any(is.na(.))) %>%
colnames()
这样,non_null_cols
就是一个包含数据集中没有任何空值的列名的向量。
对于r/sparklyr中提取数据集中没有任何空值的列名的问题,腾讯云提供了一系列与Spark相关的产品和服务,例如腾讯云的云原生数据库TDSQL、弹性MapReduce服务EMR等,可以帮助用户在云上快速搭建和管理Spark集群,进行大规模数据处理和分析。您可以访问腾讯云官网了解更多关于这些产品的详细信息和使用指南。
参考链接:
领取专属 10元无门槛券
手把手带您无忧上云