首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

linux uniq命令

uniq 是 Linux 中的一个命令行工具,用于检查和删除文本文件中的重复行。它通常与 sort 命令结合使用,因为 uniq 只能检测相邻的重复行。

基本用法

代码语言:txt
复制
uniq [选项] 输入文件

常见选项

  • -c--count:显示每行在文件中出现的次数。
  • -d--repeated:仅显示重复出现的行。
  • -u--unique:仅显示不重复的行。
  • -f--skip-fields=N:跳过前 N 个字段后比较。
  • -s--skip-chars=N:跳过前 N 个字符后比较。

示例

  1. 删除重复行

假设你有一个名为 file.txt 的文件,内容如下:

代码语言:txt
复制
apple
banana
apple
orange
banana

运行以下命令可以删除重复行:

代码语言:txt
复制
sort file.txt | uniq > output.txt

输出文件 output.txt 的内容将是:

代码语言:txt
复制
apple
banana
orange
  1. 显示重复行及其出现次数

使用 -c 选项:

代码语言:txt
复制
sort file.txt | uniq -c

输出:

代码语言:txt
复制
      2 apple
      2 banana
      1 orange
  1. 仅显示重复的行

使用 -d 选项:

代码语言:txt
复制
sort file.txt | uniq -d

输出:

代码语言:txt
复制
apple
banana
  1. 仅显示不重复的行

使用 -u 选项:

代码语言:txt
复制
sort file.txt | uniq -u

输出:

代码语言:txt
复制
orange

应用场景

  • 数据清洗:在处理大量数据时,经常需要删除或标记重复项。
  • 日志分析:检查日志文件中是否有重复的错误或事件。
  • 报告生成:确保报告中没有重复的数据行。

注意事项

  • uniq 只能检测相邻的重复行,因此通常需要先使用 sort 命令对文件进行排序。
  • 如果文件很大,排序可能会花费一些时间。在这种情况下,可以考虑使用其他工具或方法,如 awkperl 脚本,来更有效地处理数据。

总之,uniq 是一个简单而强大的工具,用于处理文本文件中的重复行。通过结合其他命令和选项,你可以轻松地完成各种数据清洗和分析任务。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Linux 命令 | uniq

Linux 命令 uniq 命令解析 uniq 的作用是用于过滤、统计和操作文本文件中相邻且重复的行。...uniq 的一般形式如下: uniq [-c| -d| -u] [-i] [input_file] [output_file] -c:在每行前面添加该行在文件中出现的次数; -d:仅显示有重复的行;...经过 uniq 命令的处理,重复的行被合并成一个,没有重复的行被保留,同时在行前面加上了出现的次数。 也可以通过 -d 参数只显示重复的行,通过 -u 参数只显示不重复的行。...Linux 命令 uniq 命令注意事项 uniq 命令只能处理相邻行的重复,如果两个重复行不在一起,需要先通过其他命令将它们放在一起再使用 uniq 命令; uniq 命令默认是区分大小写的,如果需要忽略大小写需要使用...-i 参数; 可以通过 sort 命令对文件进行排序后再使用 uniq 命令,这样可以处理任意位置的重复行; uniq 命令也可以用来查找文件中唯一的行或者查找唯一的行后删除其它行,使用 -u 参数就可以实现这样的效果

24710
  • Linux 之 uniq 命令

    命令格式 uniq [选项]... [文件] 命令选型 -c, --count 在每行开头增加重复次数。...命令参数 INPUT(可选):输入文件,不提供时为标准输入。 OUTPUT(可选):输出文件,不提供时为标准输出。 命令返回值 返回0表示成功,返回非0值表示失败。...1 rrr 先排序后统计重复的次数 查找文件中重复的行 > sort 1.txt | uniq -d 123 uniq只检测邻近的行是否重复,sort -u将输入文件先排序然后再处理重复行...忽略每行的前N个字符 > uniq -s 3 1.txt 忽略每行的前3个字符,比较后面的字符 只对前N个字符进行比较 > uniq -w 3 1.txt 只对每行的前3个字符进行比较 原文链接:https...://rumenz.com/rumenbiji/linux-uniq.html 微信公众号:入门小站

    1.3K00

    Linux进阶命令-awk&uniq

    通过这些操作,让你对Linux的操作更加得心应手,具体分成以下章节进行讲解: Linux进阶命令-echo&date&alias Linux进阶命令-top Linux进阶命令-ps&kill Linux...进阶命令-sort&wc Linux进阶命令-sed&split Linux进阶命令-awk&uniq(本章节) Linux进阶命令-逻辑或&逻辑与 Linux进阶命令-重定向 Linux进阶命令-scp...Linux进阶命令-rsync Linux进阶命令-rsync-daemon Linux进阶命令-nohup&screen Linux进阶命令-lsof Linux进阶命令-小结 shell的三剑客我们前面已经讲过了...uniq uniq 是一个用于处理文本文件的命令行工具,主要功能是去除重复的行。它通常与 sort 命令一起使用,因为 uniq 只能去除相邻的重复行。...示例 去除重复行并保留唯一行: sort file.txt | uniq 这个命令首先对 file.txt 进行排序,然后 uniq 去除重复行。

    5800

    详解uniq命令使用实例

    uniq命令本身被用作去除文本文件中的重复行,与sort命令相似,但是始终还是有区别的。文本文件在Linux中,既可以是txt,也可以是其他任意自定义格式。...1、 使用 uniq 命令删除文件中的连续重复行 如果你在不使用任何参数的情况下使用 uniq 命令,它将删除所有连续的重复行,只显示唯一的行。...uniq ostechnix.txt 示例输出: 如你所见, uniq 命令删除了给定文件中的所有连续重复行。你可能还注意到,上面的输出仍然有第二行和第四行重复了。...我们使用 sort 命令与 uniq 命令结合,因为,就像我提到的,除非重复行是相邻的,否则 uniq 不会删除它们。...欲了解更多详情,请参考帮助部分: uniq --help 也可以使用 man 命令查看: man uniq

    1K30

    Linux日志审计中的常用命令: sed、sort、uniq

    AI摘要:本文介绍了Linux日志审计中三个重要命令:`sed`、`sort`、和`uniq`的用法及其常用参数。...Linux日志审计常用命令: sed、sort、uniq 在Linux系统中,日志审计是一项重要的任务,可以帮助我们了解系统的运行状况,排查问题,并保证系统的安全。...在日志审计过程中,sed、sort和uniq是三个非常实用的命令。本文将详细介绍这三个命令的常用参数及其作用,并结合实例说明其用法。...例如,去重并按第三列的数字顺序排序: sort -u -n -k 3 data.txt 3. uniq命令 uniq命令用于去重和统计重复次数。...总结 本文详细介绍了Linux日志审计中常用的sed、sort和uniq命令的用法,并结合实例说明了它们的常用参数和作用。熟练掌握这三个命令,可以大大提高我们分析和处理日志的效率。

    23310

    10.Linux文件管理命令---uniq忽略文件中的重复行

    uniq忽略文件中的重复行作用:文件经过处理后,在它的输出文件中可能会出现重复的行。例如,使用 cat 命令将两个文件合并后,再使用 sort 命令进行排序,就可能出现重复行。...这时可以使用 uniq 命令将这些重复行从输出文件中删除,只留下每条记录的唯一样本。用法:uniq 选项...[输入输出] 主要选项如下。长选项必须使用的参数对于短选项也是必须使用的。...#uniq -u -1 +1 happy(3)用-c 选项从 uniq 中获取一些统计信息。#sort happy | uniq -dc 3 Happy Birthday to You!...这里uniq命令借助管道命令从标准输入设备读取文件,首先使用sort命令对文件进行排序, 然后对排序结果进行操作。(4)删除文件中重复的行并输出到一个新文件。...#sort happy|uniq-uniqhappy(5)高级应用。就算 uniq 对完整的行进行比较,它仍然会很有用,但是那并非该命令的全部功能。

    7310

    shell特殊符号cut命令,sort_wc_uniq命令,tee_tr_split命令

    笔记内容: l 8.10 shell特殊符号cut命令 l 8.11 sort_wc_uniq命令 l 8.12 tee_tr_split命令 l 8.13 shell特殊符号下 笔记日期:2017.8.16...8.11 sort_wc_uniq命令   sort命令可以对字符串或数字排序,排序的方法是安照ASCII码排序的,例如我排序passwd文件的内容: ? 例如排序一个含有特殊字符的文件: ?...wc -l命令是统计行数的: ? 加-m选项则是统计字符数,包括换行符: ? 加- w选项是安照单词统计,这个单词是以逗号或者空格分开的一个个词: ? uniq命令是去掉重复的字符: ? ?...uniq命令可以和sort命令搭配使用,先排序去重: ? 8.12 tee_tr_split命令   tee命令和输出重定向有点像,它们的区别是tee是可以看到输出重定向的结果,>则不能看到: ?...想要把多条命令写在一行里,就需要使用分号分割: ?   ||是或者的意思,写在两条命令中间的话只要左边的命令执行成功,那么右边的命令就不会执行。如果左边的命令执行失败,那么右边的命令就会执行: ?

    1.7K10

    cut-sort-uniq

    一、cut 1.1 软件介绍 cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。如果不指定 File 参数,cut 命令将读取标准输入。...sort 命令用于对文本内容进行再排序,语法格式为“sort [参数] 文件名称”。有时文本中的内容顺序不正确,一行行地手动修改实在太麻烦了。...此时使用 sort 命令就再合适不过了,它能够对文本内容进行再次排序。这个命令一定要借助于实战一看就懂。...3.1 软件介绍 uniq 是 unique 的意思,和 sort -u 的功能差不多,uniq 能够将文件中的重复删除掉,只留下每条记录的唯一值,一般与 sort 命令结合使用。...3.2使用案例 #1 计算特异 cat scores.txt | cut -f 2 | uniq #2 计算频数 cat scores.txt | cut -f 2 | uniq -c cat

    85120

    【Linux】:文件查看 stat、cat、more、less、head、tail、uniq、wc

    前言 在Linux系统中,文件是信息的核心。深入了解和操作文件内容是每个系统管理员和开发者必备的技能。...本文将为您揭开Linux文件魔法的面纱,介绍一系列强大的命令,包括stat、cat、more、less、head、tail、uniq和wc。...说明:stat命令是Linux系统中的一个常用命令,用于查看文件或目录的属性信息。 通过使用stat命令可以查看文件或目录的创建时间、修改时间、访问时间、文件类型、文件大小、文件权限等详细信息。...例如: cat image.jpg 2.3 less less 工具也是对文件或其它输出进行分页显示的工具,应该说是linux正统查看文件内容的工具,功能极其强大。...语法: uniq [选项] [输入文件 [输出文件]] 示例: uniq file.txt 说明: uniq 常常与排序命令sort 结合使用,以便去除相邻的重复行。

    26010
    领券