我有一个没有分隔符的数据文件。我得到了一个数据键,它告诉我变量从哪里开始--计算在空格的数量中--以及每个变量的字符数。 我将展示数据的简化版本,如下所示。假设括号中的每个数字都是数据文件中的一个空格。下面的字母是每个变量(变量A和B)。 因此,变量A从第三个空格开始,长度为2个字符。变量B从第6个空格开始,长度为3个字符。 [1][2][3][4][5][6][7][8][9]
A A B B B
A A B B B
A A B B B
A A B B B
我确实意识到已经有人提出了类似的问题,但考虑到提供的答案都没有解决我的问题,挫败感开始出现。问题如下:我有27个相同形状的txt格式的时间序列数据(date,Open,High,Low,Last),我想以这样的方式将它们导入R中作为.txt文件,即读取的第一行是包含所有5个数据的那一行。下面给出的示例显示,虽然文本文件中的数据从1984-01-03开始,但我希望从1990-11-05开始读取该文件(因为较早的日期缺少Open ),将日期的第一列保存为行名,并将其他4列保存为数字,并为每列使用明显的名称。
Open High Low Last
1984
我有一个以制表符分隔的文件,它包含3列(BookID、BookName、BookReview);
0001 Hannibal This was a great book that is awesome.....etc.......
我正在尝试对书评做一些文本挖掘,但我需要维护数据集的结构,以便可以一次挖掘每本书的id,而不是将所有书评混合在一起。当我尝试将它读入R时,我得到了一个错误,并且丢失了大部分记录
我正在努力;
dat <- read.table(~/my_text.txt,sep='\t')
如何才能在不丢失数据的情况下将其读入R?
我有一个类似下面的文本文件(用空格分隔):
x <- "DF12 This is an example 1 This
DF12 This is an 1232 This is
DF14 This is 12334 This is an
DF15 This 23 This is an example
"
我知道每个变量的字段长度(这个数据集中有5个变量),它们是:
varlength <- c(2, 2, 18, 5, 18)
如何使用varlength变量作为字段分隔符,将这种类型的数据导入R?
我有像这样的文本表:
in.data <- rbind(
c("ColA KB Col C The ColE (2.0)"),
c("abc def ghijklm n opqrst"),
c("uv wx y zzzzzz aa bcd"),
c("ab cd gh jklmn")
)
我需要这样的:
wanted.result <- rbind(
c("abc", "def", "
我有一个有1000个向量的数据帧,它们都类似于这个001010...等。
我正在尝试创建一个数据框,其中每个向量都是一列,每行都是该向量中的一个数字。
所以我的第一个向量是:
vector1
0
0
1
0
1
0
...
这就是我到目前为止尝试过的方法,但我还没有让它工作。
text <- data_frame()
for (i in 1:length(text_vector_data)){
for (digit in i){
text_df <- rbind(digit, text)}
}
str(text_vector_data)输出为
ti
我正试着从上读取气象站的信息。但是,由于第一行没有完全填充(缺少最后两个科尔),而且第5列包含空格,所以我无法用以下内容完成阅读:
fread('ftp://ftp.ncdc.noaa.gov/pub/data/ghcn/daily/ghcnd-stations.txt',sep=)
它返回错误消息:
Expected sep (' ') but new line, EOF (or other non printing character) ends
field 5 when detecting types from point 0: AGE0013503
下面是一个例子。
library(tidyverse)
df<-data.frame(x=c("a-b-c", "b-d","c-d_e-f"))
df
# x
#1 a-b-c
#2 b-d
#3 c-d_e-f
我想要的是第一个separate列x,因此需要的输出是:
x y
1 a b-c
2 b d
3 c d_e-f