生信技能树学习笔记
Linux文本处理——grep
grep:一种强大的文本搜索工具,它能使用正则表达式匹配模式搜索文本,并把匹配的行打印出来
格式:grep [options] pattern file
常见参数:
-w:word 精确查找某个关键词 pattern
-c:统计匹配成功的行的数量
-v:反向选择,即输出没有没有匹配的行
-n:显示匹配成功的行所在的行号
-r:从目录中查找pattern
-e:指定多个匹配模式
-f:从指定文件中读取要匹配的 pattern
-i:忽略大小写
示例
问题1:精确查找某个内容
精确后-w
问题2:当单词前后有符号如何精确匹配
带着前后一起匹配
如何打空格 :ctrl+V+I
问题·3:统计匹配上的行数。
问题4:反向选择,统计不包含的行。
问题5:多个关键词匹配?-e
方法二 创建关键词文件 用grep 读取
正则表达式:是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
^ 行首
$ 行尾
. 换行符之外的任意单个字符
? 匹配之前项0次或者一次
另一种方法 -E 后面的字符都识别为正则表达式
+ 匹配1次或者多次
* 匹配0次或者多次
{n} 匹配n次
{n,} 匹配至少n次
{m,n} 至少m,最多n
[] 匹配任意一个
[^] 排除字符
| 或者