前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基础知识 | R语言高级数据管理之函数

基础知识 | R语言高级数据管理之函数

作者头像
黑妹的小屋
发布2020-08-06 15:01:30
6220
发布2020-08-06 15:01:30
举报
文章被收录于专栏:菜鸟学数据分析之R语言

R语言数据管理之函数篇

在做任何数据分析的第一步,是根据个人需求创建数据集,存储数据的结构是多样的,包括向量,矩阵、数据框、因子以及列表等。其实,以上几个R语言的独特术语,在C++中也会经常用到,导致很多人都会误认为自己很熟悉了,然而在实际的应用中,却经常出现错误。最近在处理一波量大的数据,在运行程序的过程中,因为前期数据处理错误却出现各种bug,经过检查数据集发现是数据管理的问题,为了巩固R语言的基本数据管理,特地重新基础知识。

01

数学函数

代码语言:javascript
复制
> x<-c(1,2,3,4,5,6,7,8,9)
> mean(x)
[1] 5
> sd(x)
[1] 2.738613

02

概率函数

#正态分布函数

代码语言:javascript
复制
x<-pretty(c(-3,3),30)
y<-dnorm(x)
plot(x,y,type="l",xlab="NormalDeviate",ylab="Density",yaxs="i")

#指数函数

代码语言:javascript
复制
y<-exp(x)
plot(x,y,type="l",xlab="NormalDeviate",ylab="Density",yaxs="i")

03

随机数的生成

#生成7个随机数

代码语言:javascript
复制
> runif(7)
[1] 0.38380225 0.49297152 0.28230372 0.25986600 
0.70236043 0.98603726 0.02660941

#再次调用随机数,会发现新生成的和第一次生成的有区别

代码语言:javascript
复制
> runif(7)
[1] 0.7906136 0.2597749 0.2442815 0.7137956
 0.9609680 0.2076069 0.7164634

#若要重现生成的7个随机数,可以用随机数的种子函数

代码语言:javascript
复制
> set.seed(1234)
> runif(7)
[1] 0.113703411 0.622299405 0.609274733 0.623379442 
0.860915384 0.640310605 0.009495756
> set.seed(1234)
> runif(7)
[1] 0.113703411 0.622299405 0.609274733 0.623379442 
0.860915384 0.640310605 0.009495756

小结

R语言最大的优势是绘图,学R的初心就是为了绘制实验过程产生的数据图,然而随着深度学习,会发现,R语言的数据分析也很重要,常常会在绘制图形的过程中,因为数据框中存在格式不统一,字符或者缺失值等原因导致绘图失败。对于非数学专业又喜欢R语言的人来说,学R之路漫漫其修远,没有极客基因是不行的,打好基础是进阶的前提!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 菜鸟学数据分析之R语言 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档