Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >如何在 Linux 中查看目录大小?

如何在 Linux 中查看目录大小?

作者头像
章鱼猫先生
发布于 2021-10-15 05:39:38
发布于 2021-10-15 05:39:38
13.1K00
代码可运行
举报
文章被收录于专栏:BioIT爱好者BioIT爱好者
运行总次数:0
代码可运行

这是一篇关于如何通过一些常用的命令,显示 CentOS 或 RedHat 中的 Linux 目录大小,以及哪些文件夹占用的空间最大的教程。

搜索当前的 CentOS 或 RedHat 文件夹

您可以使用以下命令,在命令行中向下搜索当前文件夹的大小:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
du -h --max-depth=1  |grep -v -e [0-9].[0-9]K -e [0-9][0-9]K -e ^0 | sort -n

在 Linux 文件夹中查找前 10 个大文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
find /home/shenweiyan/Downloads -xdev -type f -exec du -sk {} \; |sort -rn | head -10

在 Linux 中查找使用率高的磁盘

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df -P | awk '0+$5 >= 70 {print}'        # 其实 du -Th 就可以直接看

将限制更改为 10% 的示例

安装软件包以检查 Linux 目录大小

Ncdu 是 NCurses 磁盘使用率的首字母缩写。这是查看正在使用磁盘空间的目录的快速方法。它是一种简单快速的磁盘使用情况分析器,用于查找哪些目录或文件占用了更多空间。

要在 RHEL,CentOS 上安装 ncdu,请使用下面的命令安装:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install ncdu

安装后,只需键入 ncdu 即可开始:

ncdu 键盘快捷键

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
up, down j, k         - 在各个项目条目之间循环;
right, enter, l     - 打开光标所在的目录;
left, <, h              - 回到父目录;
n                             - 按文件名排序(再次按降序排列); 
s                             - 按文件大小排序(再次按降序排列); 
C                             - 按项目数(即该目录下的文件总数)排序(再次按降序排列);
c                             - 切换子项计数的显示;
a                             - 在显示磁盘使用情况和显示大小之间切换;
M                             - 按最近的 child mtime 或修改时间排序(再次按降序排列)需要 -e 标志;
m                             - 切换最近的 child mtime或修改时间的显示。需要-e标志;
d                             - 删除选定的文件或目录。当目录的内容与文件系统不匹配或不再存在时,将显示一条错误消息;
g                             - 在显示百分比,图形或两者之间切换。百分比是相对于当前目录的大小,图是相对于当前目录中的最大项目;
e                             - 显示/隐藏“隐藏”或“排除”的文件和目录。请注意,即使看不到隐藏的文件和目录,它们也仍然存在,并且仍包含在目录大小中;
i                             - 显示有关用法和大小的突出显示的项目信息;
r                             - 重新计算当前目录;
b                             - 在当前目录中生成 bash shell;
q                             - 退出 ncdu;

NCDU 示例

要扫描和浏览您当前所在的目录,只需一个简单的操作:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ncdu

如果要扫描整个文件系统(例如,根文件系统),则需要使用 -x

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ncdu -x /

ncdu 扫描整个文件系统

由于扫描大型目录可能需要一段时间,因此您可以扫描目录并导出结果以供以后查看:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ncdu -1xo- / | gzip >export.gz  

扫描完成后,可以通过下面的命令查看扫描结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
zcat export.gz | ncdu -f-

提示:要从 cron 作业导出,请确保将 -1 替换为 -0 以禁止任何不必要的输出!

扫描完成后,您还可以导出目录并浏览目录:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ncdu -o- | tee export.file | ncdu -f-

使用 gzip 压缩的结果也可以做到这一点,但有点麻烦:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ncdu -o- | gzip | tee export.gz | gunzip | ncdu -f-

要远程扫描系统,但在本地浏览文件:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ssh -C user@system ncdu -o- / | ncdu -f-

ssh 的 -C 选项会启用压缩,这对于慢速链接非常有用。与直接在远程系统上运行 ncdu 相比,远程扫描和本地查看具有两个主要优点:您可以浏览本地系统上的扫描目录而没有任何网络延迟,并且 ncdu 在导出时不会将整个目录结构保留在内存中, 这样您就不会在远程系统上消耗太多内存。

结论

如您所见,Linux 目录大小可以通过多种不同的方法来确定,如果您还有其他一些经常使用的相关命令,欢迎在下面的评论中添加。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 BioIT爱好者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
T细胞状态打分R包应用于单细胞转录组数据
我们首先了解一下打分工具的本质,首先是带有生物学功能意义的基因集合的数据库资源,其次是统计学公式。前者可以是免疫或者代谢等基因集,主要是来源于msigdb等数据库。后者统计学公式对大家来说最容易理解的就是gsea或者gsva啦。比如我前两天介绍的:单细胞GSVA分析专用R包
生信技能树
2024/07/26
4770
T细胞状态打分R包应用于单细胞转录组数据
vissE--提供不同的基因集富集分析方法!
通常,基因集富集分析的结果(例如使用 limma::fry、singscore 或 GSEA)由一长串基因集组成。然后生物学家必须搜索这些列表,以确定新出现的主题来解释改变的生物过程。这项任务可能是劳动密集型的,因此需要解决方案来总结来自此类分析的大量结果
作图丫
2022/03/29
5450
vissE--提供不同的基因集富集分析方法!
百万级单细胞GSVA如何提速?
尽管可以使用parallel.sz进行加速,但是数据量大的依然非常耗费计算机资源,耗费时间:
生信技能树
2025/01/01
1680
百万级单细胞GSVA如何提速?
数据分析:基于STAR+FeatureCounts的RNA-seq分析全流程流程
分析流程涉及到众多的软件以及R包等,为了更方便配置该环境,建议使用anaconda软件安装。anaconda是包管理工具,可以将软件作为其包进行安装管理,并且可以设置多个环境,方便不同依赖环境的软件在同一台机器安装。安装anaconda方法见网上教程。
生信学习者
2024/07/05
5480
单细胞irGSEA分析:整合多种富集分析方式的R包
irGSEA整合了多种基于单个细胞表达等级的富集分析方法(AUCell、UCell、singscore、ssGSEA、JASMINE和Viper),并通过秩聚合算法(robust rank aggregation, RRA)对差异分析的结果进行评估,筛选出在这种几种方法中表现出相似的富集程度的差异基因集。
凑齐六个字吧
2024/08/16
4110
OSCA单细胞数据分析笔记11—Cell type annotation
“物以类聚”的类是什么类?比如将一群水果分为不同的类群,则又红又圆特征的可能是苹果。对于单细胞聚类的结果,类的最直接注释就是细胞类型。本节将学习单细胞数据分析过程中注释细胞类型的三种思路。
生信技能树jimmy
2021/07/02
2K0
OSCA单细胞数据分析笔记11—Cell type annotation
新TCGA+文献复现里的几种算法
reads计数数据(测序的短片段),会匹配到基因。若匹配到,则匹配到的基因会count+1。(一个基因对应4个read,即count为4)
用户10758803
2024/03/10
2950
10X单细胞空间数据分析之富集篇
一个不算正式的引言:目前来说,基于基因集进行分析已经开发出来了很多成体系的R包或者流程,理解来看,基因集评分其实就是自定义一个评分,然后来衡量目标基因集在某组织的表达情况,进而来推断其功能富集情况,所以说,这个给了我们以提示,算法是一定的,但是参考基因集可以是不同的,比如说铁死亡、铜死亡、细胞衰老等等
追风少年i
2023/06/03
1.4K0
10X单细胞空间数据分析之富集篇
单细胞各个亚群基因按照平均表达量排序后gsea分析
如果一定要做gsea或者gsva这样的给基因集合打分,也有几个补救措施,比如把单细胞表达量矩阵进行缺失值插补,或者把单细胞表达量矩阵构建成为metacell矩阵。不过,最简单的方法是把单细胞表达量矩阵按照各个亚群来进行表达量平均,我们以大家熟知的pbmc3k数据集为例,大家先安装这个数据集对应的包 SeuratData,并且对它进行降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释 ,而且每个亚群找高表达量基因,都存储为Rdata文件。标准代码是:
生信技能树
2023/02/28
1.2K0
单细胞各个亚群基因按照平均表达量排序后gsea分析
8种方法可视化你的单细胞基因集打分
偶尔逛朋友圈发现一年前跟着我们生信技能树学生信的研究生开发了自己的单细胞数据分析相关R包,4(热图,气泡图,upset图,堆叠条形图)+4(密度散点图,半小提琴,山峦图,密度热图)美图吸引了我的注意力,果断邀稿,希望可以介绍他的R包使用方法,以及开发新的体会!
生信技能树
2021/10/21
17.4K1
8种方法可视化你的单细胞基因集打分
玩转scanpy和seurat对细胞群基因集打分和可视化基因集富集情况
在进行单细胞数据挖掘过程中,为了探明细胞亚群基因集的富集情况,通常会对细胞亚群进行基因集打分。通过对细胞亚群进行基因集打分,再通过画图可视化展示,可以看清各个细胞亚群的基因集富集情况,下面我们使用示例数据集通过scanpy和seurat进行基因集打分演示。
生信技能树jimmy
2024/04/01
1.2K0
玩转scanpy和seurat对细胞群基因集打分和可视化基因集富集情况
使用自定义基因集对单细胞数据打分,应该用什么函数或者R包呢?
群里小伙伴在前几天有提到这个问题,想了一下我的确没写过相关的推文,但是我发现相关的推文在微信公众号上还是能搜索到不少的。我来写个总结性的推文吧~
生信菜鸟团
2023/09/29
1.6K0
使用自定义基因集对单细胞数据打分,应该用什么函数或者R包呢?
单细胞测序—标准分析流程(4)—GSEA与GSVA
https://github.com/rcastelo/GSVA/issues/172
sheldor没耳朵
2024/09/05
6460
单细胞测序—标准分析流程(4)—GSEA与GSVA
单细胞数据分析之缺氧评分
评分的算法很多,gsea,gsva等等,单细胞领域比较出名的是Seurat包的AddModuleScore函数,以及UCell和AUCell等包,从代码的角度来看,都是一个函数即可。
生信技能树
2022/06/08
2.2K0
单细胞数据分析之缺氧评分
单细胞转录因子分析之SCENIC流程
SCENIC (Single-Cell rEgulatory Network Inference and Clustering) is a computational method to infer Gene Regulatory Networks and cell types from single-cell RNA-seq data. 官网教程非常清晰:
生信技能树
2021/01/06
9.6K2
单细胞各个亚群特异性高表达基因的数据库注释(包括GO,KEGG,ReactomePA)
拿到了一个单细胞表达量矩阵,默认需要进行: 单细胞聚类分群注释 ,如果你对单细胞数据分析还没有基础认知,可以看基础10讲:
生信技能树
2022/12/16
1.3K0
单细胞各个亚群特异性高表达基因的数据库注释(包括GO,KEGG,ReactomePA)
用clusterProfiler对单细胞的基因做功能富集分析超简单!!
「用dotplot画出来的图纵坐标重叠部分比较高,我没进行调整, 下面我就使用ggplot又美化了一下」
生信菜鸟团
2023/09/09
2.3K0
用clusterProfiler对单细胞的基因做功能富集分析超简单!!
从msigdb下载的hallmark基因集里面的基因数量上限是200??
第一次提问:帮我介绍一下 msigdbr 包,以及它背后的msigdb数据库资源,分门别类
生信技能树
2024/11/21
1130
从msigdb下载的hallmark基因集里面的基因数量上限是200??
单细胞GSVA分析专用R包
之前我们介绍过irGSEA:基于秩次的单细胞基因集富集分析整合框架,针对17种常见的Functional Class Scoring (FCS)方法进行了benchmark,感兴趣的可以仔细读一下。最近恰好看到了密西根大学的Research Assistant Professor Neurology的Kai Guo的github也有一个打分工具:https://github.com/guokai8/scGSVA ,也值得介绍一下:
生信技能树
2024/11/21
1730
单细胞GSVA分析专用R包
如何批量查询单个基因的功能通路?
学员的基因我们就不放了,我们随便找一个基因比如 EPCAM,一个上皮细胞的经典基因。我们上面讲了,基因的注释与富集含义是一样的,只不过富集是显著注释的通路,通过卡一个pvalue或者其他的阈值挑选得到,那我们第一种方法就用功能富集的方式拿到这个基因注释到的通路:
生信技能树
2025/02/19
900
如何批量查询单个基因的功能通路?
推荐阅读
相关推荐
T细胞状态打分R包应用于单细胞转录组数据
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验