(1)R的代码都是带括号的,括号必须是英文的;
(2)显示工作路径getwd()
(3)向量是由元素组成的,元素可以是数字或字符串
(4)表格在R语言中称为“数据框”
(5)查看帮助:?read.table
,调出对应的帮助文档,翻到example部分研究一下
(6)数据类型:
①向量(vector)
②矩阵(Matrix)
③数组(Array)
④数据框(Data frame)
⑤List
元素:指的是数字或者字符串(用chr表示)等
标量:一个元素组成的变量
向量:多个元素组成的变量
注意:一个向量是一排有序排列的元素,之后可用到把一个向量作为数据框中的一列。
1、根据元素位置
示例
> x<-1:10
> x[4]
[1] 4
> x[-4]
[1] 1 2 3 5 6 7 8 9 10
> x[2:4]
[1] 2 3 4
> x[-(2:4)]
[1] 1 5 6 7 8 9 10
> x[c(1,5)]
[1] 1 5
2、根据值
示例
> x[x==9]
[1] 9
> x[x<7]
[1] 1 2 3 4 5 6
1、获取示例数据并放在自己的工作目录下(数据来源公众号生信星球)
我直接将下载的示例数据移动到当前工作目录的文件夹中了。并用X<-read.csv('doudou.txt')
获得示例数据框(如下所示)
> getwd()
[1] "F:/Rstudio_Projects_automaking/day5_data.structure" # 先查看了一下当前工作目录
> X<-read.csv('doudou.txt')
> X
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
2、读取本地数据
示例
> read.table(file = "huahua.txt",sep = "\t",header = T)
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
> a<-read.table(file = "huahua.txt",sep = "\t",header = T)
> a
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
3、查看行名和列名、行数和列数
> colnames(a)
[1] "X1" "X2"
> rownames(a)
[1] "1" "2" "3" "4" "5"
> dim(a) # 查看一共有几行几列
[1] 5 2
4、数据框的导出
write.table(a,file = "my.txt",sep = ",",quote = F)
5、变量的保存和重新加载
保存的格式是.RData
> save.image(file = "bioinfoplanet.RData") # 保存当前所有变量
> save(a,file = "test.RData") # 保存其中一个变量
> load("test.RData") #再次使用RData时的加载命令
6、提取元素
下列中“a”和“X”都是前文引入的变量名。
> a[4,2] # a中第4行第2列
[1] 3
> X[4,2] # X中第4行第2列
[1] 3
> a[1,] # a中第1行
X1 X2
1 A 1
> X[,1] # X中第1列
[1] "A" "B" "C" "D" "E"
> X[1] #也是X中第1列,可以看到二者的输出结果有略微差异
X1
1 A
2 B
3 C
4 D
5 E
> X$X1# 代码含义:"变量名$列名",也能用来提取列
[1] "A" "B" "C" "D" "E"
问题:save(a, file="testxRData"), 这句代码如果报错object a not found, 是为什么,应该怎么解决。
回答:原因,并没有创建"a"的变量,所以找不到a这个变量。
解决:将变量a替换为已经创建的变量,或者新建一个名为a的变量。
微信公众号生信星球
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。