在R中,默认的提示语言根据用户的系统语言设置而定。若需要统一修改为英文,可通过以下步骤操作:
Sys.getlocale() # 显示当前系统语言设置
Sys.setenv(LANG="en") # 设置默认语言为英文
memory.size() 函数用于查看当前R会话消耗的内存大小,但此函数仅在Windows系统中有效。
memory.size() # 输出内存大小,单位为MB
使用object.size()函数可以查看任意数据集的内存占用,单位默认为字节。若需转换为KB,可以进行简单的除法运算:
object.size(mtcars) # 显示mtcars数据集的内存大小,单位为字节
object.size(mtcars) / 1024 # 转换为KB
在RStudio中,回车键默认执行代码。若在编辑时需要换行而不执行,可以使用Shift + Enter。
function(x, y) {
# 你的代码
}
在R中,你可以在赋值的同时直接显示变量的值,通过将赋值语句包含在括号中实现:
(x <- runif(10)) # 赋值并显示x的值
想查看某个R函数的源代码,可以直接输入函数名,不加括号:
mean # 显示mean函数的源代码
为避免每次安装R包时弹出选择镜像的对话框,可以预先指定CRAN镜像:
chooseCRANmirror(ind = 18) # 直接选择适合你的编号为xx的镜像
默认情况下,R显示1000行数据。通过设置max.print可以调整这一限制:
options(max.print = 2000) # 设置为显示2000行数据
默认情况下,R显示数字时保留7位小数。通过调整digits选项可以修改这一设置:
options(digits = 2) # 设置默认显示两位小数
使用管道符号%>%可以让代码更加简洁,避免定义过多的中间变量。在R中使用管道前需要加载相关的包:
library(magrittr) # 加载magrittr包以使用管道
mtcars %>% ggplot(aes(x = cyl, y = mpg, group = cyl)) + geom_boxplot()
在使用数据集时,有时记不住列名或容易拼错。使用attach()函数可以将数据集中的每一列变成一个独立的变量,方便直接调用:
attach(mtcars)
cyl # 显示cyl列的数据
mpg # 显示mpg列的数据
如果有经常使用的R包,可以通过修改.Rprofile文件设置R启动时自动加载这些包。例如,自动加载ggplot2包:
file.edit("~/.Rprofile")
.First <- function() {
library(ggplot2)
}
可以通过修改.libPaths()来添加额外的包安装路径,使R能够在新的目录中查找和安装包:
.libPaths(new = "C:/Users/genom/Desktop/nparFiles/") # 添加新路径
.libPaths() # 显示当前所有库路径
当需要在不同设备之间迁移已安装的R包时,可以先在源设备上保存已安装包的列表,然后在目标设备上使用该列表进行安装:
# 在源设备上
save(installed.packages()[,1], file = "installedPackages.Rdata")
# 在目标设备上
load("installedPackages.Rdata")
for (i in setdiff(installed.packages()[,1], oldip)) {
install.packages(i)
}
要查看某个R包中包含的所有函数,可以使用ls()函数指定包名:
ls(package:base) # 列出base包中的所有函数
在不加载整个R包的情况下使用其中的某个函数,可以使用“包名::函数名”的格式:
dplyr::filter() # 使用dplyr包中的filter函数
在需要快速为图形设置颜色时,可以使用rainbow()函数快速生成多种颜色:
rainbow(6) # 生成并显示6种不同的颜色
虽然使用attach()函数可以简化数据列的调用,但这可能导致环境变量混乱。使用%$%特殊管道符可以更安全地实现相同效果:
library(magrittr)
women %$% plot(weight, height) # 使用“炸开”数据来绘图
example()函数运行R帮助文档中的示例代码,是学习函数使用方法的好助手:
library(pheatmap)
example("pheatmap") # 运行并展示pheatmap函数的示例
使用system.time()函数可以测量一段代码的运行时间:
system.time(runif(100000000)) # 测量生成一亿个随机数的时间
在R中,即使删除了变量,内存也不会立即释放。可以通过gc()函数手动触发垃圾回收,释放内存:
memory.size() # 显示当前内存使用量
rm(list = ls()) # 删除所有变量
gc() # 执行垃圾回收
memory.size() # 再次显示内存使用量
ls() # 显示所有变量
rm(list = ls()) # 删除所有变量
gc() # 执行垃圾回收
如果不慎删除或覆盖了内置数据集,可以通过data()函数恢复:
data("mtcars") # 恢复mtcars数据集
head(mtcars) # 显示数据集的前几行
使用args()函数可以快速查看任何R函数的参数列表,无需查阅帮助文档:
args(heatmap) # 显示heatmap函数的参数列表