本篇内容引自生信技能树
命令 | 常见参数 | 常见用法 |
---|---|---|
cat 查看文本文件的内容,输出到屏幕 | ①-A ## 打印所有内容,包括特殊字符,如制表符,回车键$;②-n ## 打印出所有行号,-b 参数仅打印非空白行行号 | ①往文件里面写东西:$ cat > file (>是重定向符),输入内容存入file,按ctrl+c终止,最后 cat file 查看;②zcat:可以查看压缩的文本文件。 |
head / tail -n :查看文件的前/后 n 行,默认 10 行 | -n :查看文件的前/后 n 行 | $ cat Data/example.gtf | head -n 3,| 是管道符 |
more 参数 文件名 | 逐页查看,按空格翻页,按回车换行, 按q退出 | 用法比less简单一些,less是升级版的more |
less 参数 文件名 | ①-N:显示行号;②-S:单行显示;③zless:查看压缩文件;④用“/keyword”进行关键词查询;⑤n/N:上下浏览关键词;⑥g/G:快速回到开头/末尾。 | more和less有自己独立的空间展示,不会打印到屏幕上,但可以用管道符传递给head,使其打印出来。 |
命令 | 常见参数 | 常见用法 |
---|---|---|
wc:统计文本 | ①-l 统计行数;②-w 统计字符串数(包括空格);③-c 统计字节数; | ①可以放好几个文件进行统计;②多用来统计行 |
cut:文本切割 | ①-d 指定分隔符,默认\t(tab)键,;②-f 输出哪几列(字段fields),不可省略,可以多输出几列(1,3-5,7)。 | ①cut –d不只可以指定标点符号为分隔符,也可指定字母或者数字等字符为分隔符(cut –d 'h'),以h作为分隔符。 |
sort:排序 | ①-n:按照数值从小到大进行排序;②-V:字符串中含有数值时,按照数值从小到大排序;③-④r:逆向排序;⑤-k:指定按哪一列排序;⑥-t:指定分隔符; | ①cat Data/example.gtf |sort -k 4 -n | less -SN 必须用 -k指定列,其它参数往列的后面放; |
uniq:去除重复行 | -c:统计每个字符串连续出现的行数 | uniq比较”懒”,只能去除相邻的重复行!因此记得要跟sort连用 |
paste:文本合并 | -d:指定分隔符-s:按行合并 | ①上下合并用cat,左右合并用paste;②paste file1 file2 ;③ seq 20 | paste - -两两成行。 |
tr:字符替换 | -d:删除指定字符(删除空格)-s:缩减连续重复字符(可以整好看一点,练习题7有) | tr ‘’ ‘’把前者替换为后者 |
md5sum:生成md5值 | -c:检验md5值 | ①md5sum <文件>;②md5sum Data/reads.1.fq.gz >reads.1.fq.gz.md5;③cat reads.1.fq.gz.md5;④md5sum -c reads.1.fq.gz.md5 |
补充:column -t 该命令可以让输出更整齐;制表符(\t,输入)(^I,cat显示);换行符(\n,输入)($,cat显示);MD5的用途:用于验证数据的完整性,严格程度是一模一样。 |
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。