从URL中提取.zip、.R格式或任何其他格式,并使用R形成一个新列的方法如下:
gsub()
函数来替换URL中的非文件名字符,只保留文件名和扩展名部分。url <- "https://example.com/files/data.zip"
filename <- gsub(".*/(.*\\..*)", "\\1", url)
上述代码中,gsub()
函数的第一个参数是正则表达式,.*/(.*\\..*)
表示匹配URL中最后一个斜杠后的文件名部分。第二个参数\\1
表示保留匹配到的内容。
strsplit()
函数将文件名按照点号分割成多个部分,然后取最后一个部分作为扩展名。extension <- strsplit(filename, ".", fixed = TRUE)[[1]][2]
上述代码中,strsplit()
函数的第一个参数是要分割的字符串,第二个参数是分割符号,fixed = TRUE
表示使用固定的点号作为分割符号。[[1]]
表示取分割后的第一个部分,[2]
表示取该部分的第二个元素。
data <- data.frame(url = "https://example.com/files/data.zip")
data$extension <- strsplit(gsub(".*/(.*\\..*)", "\\1", data$url), ".", fixed = TRUE)[[1]][2]
上述代码中,data.frame()
函数用于创建一个包含URL的数据框。data$extension
表示在数据框中创建一个名为extension
的新列,并将提取到的文件扩展名赋值给该列。
这样,你就可以从URL中提取.zip、.R格式或其他格式,并使用R形成一个新列。根据实际情况,你可以将上述代码进行适当修改和扩展,以满足你的具体需求。
领取专属 10元无门槛券
手把手带您无忧上云