腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
sort
和
uniq
对
大文件
中
的
行
执行
重复
数据
消除
失败
、
、
、
我有一个很大
的
文件,其中每行包含一
行
JSON,共1563888
行
。为了
对
这个文件
中
的
行进行
重复
数据
删除,我一直
使用
shell单行程序
sort
myfile.json |
uniq
-u。对于较小
的
文件,此方法有效,
sort
myfile.json |
uniq
-u | wc -l大于0。由于现在
的
文件大小,运行
sort
浏览 27
提问于2019-04-30
得票数 1
回答已采纳
3
回答
获得
重复
行
和文件
的
其余部分[
大文件
50G]
、
我有一个
大文件
50G,我想得到文件
的
重复
行
和
其余部分,我
使用
两个命令来获得结果,这需要很长时间。
sort
file.tsv |
uniq
-d > duplicateList.tsv 由于您可以看到这个过程
重复
了两次,所以我希望只
执行
一个命令,并返回这两个结果,而不
使用
浏览 5
提问于2021-10-22
得票数 4
5
回答
Unix
uniq
实用程序:这段代码有什么问题?
我想要完成
的
任务:print duplicated linesSYNOPSIS only print duplicate linesroot@laptop:/var/www# cat file.tmp BarQux root@laptop:/var/www# cat file.tmp |
un
浏览 3
提问于2010-06-27
得票数 0
回答已采纳
3
回答
排序查找特定列中有多少不同
的
值。
、
、
、
例如,这是list.txtJack 1Fox 2Jones 6然后输出应该是5,因为2rd列中有5个不同
的
值。我应该如何仅
使用
sort
cut wc
uniq
来完成这一任务?我有一个想法,首先
使用
sort
-k2n按递增顺序
对
第二列进行排序,然后
使用
uniq
消除
第二列
重复
的
行
,结果如下 C
浏览 0
提问于2018-01-31
得票数 2
回答已采纳
4
回答
为什么"
uniq
“会把相同
的
单词算作不同
的
单词?
、
、
、
我想从一个文件中计算单词
的
频率,其中单词是逐行
的
。这个文件真的很大,所以这可能是问题所在(在本例
中
它有300k
行
)。我
执行
以下命令:问题是,它给了我一个小错误:它将相同
的
单词视为不同
的
单词。例如,第一个条目为:278 apertura 189 mur
浏览 0
提问于2012-08-08
得票数 6
回答已采纳
1
回答
删除包含相同信息但顺序不同
的
行
、
假设我有两
行
(在txt文件
中
)Tuesday, Monday, Week 它们包含相同
的
信息,但是信息(第一列
和
第二列)在每一
行
中
的
顺序不同,所以我不能简单地
使用
sort
或
uniq
来
消除
它们。如何删除包含相同信息
的
所有
重复
行
?
浏览 0
提问于2016-11-24
得票数 4
1
回答
如何在linux
中
从文件
中
获取唯一实例
、
、
、
我有一个data.txt文件,如下所示11001当我尝试
的
时候,我连续获取多次出现
的
uniq
值100有没有办法,我可以得到如下结果
浏览 1
提问于2013-05-28
得票数 0
回答已采纳
2
回答
删除文本文件
中
的
重复
数据
。
、
、
我有一个文本文件,我想删除一些
行
。文件
的
示例内容如下--v2 has output 10.2v4 has output 1.1------------------正如上面所看到
的
,1.1
和
10.2值
重复
了几次,我希望保留前10
行
1.1
和
10.2并与它们相似(这些值是不同
的
,有上百个不同
浏览 1
提问于2018-09-06
得票数 0
回答已采纳
2
回答
cut
中
的
分隔符是什么意思?为什么在此命令
中
它要排序两次?
、
、
、
、
我试图找出这个命令
的
原因,因为我知道很基本,我发现last =上次搜索文件/var/log/wtmp (或由var标志指定
的
文件),并显示自创建该文件以来登录(
和
注销)
的
所有用户
的
列表。cut用于显示所需
的
列。-f
浏览 2
提问于2014-03-21
得票数 0
7
回答
在文件
中
查找
重复
的
行
,并计算每行被复制
的
次数?
、
、
、
、
假设我有一个类似于以下内容
的
文件:123 234 345123 3 345 1
浏览 1
提问于2011-07-16
得票数 624
回答已采纳
1
回答
从单个或多个大型文件中排序
和
删除
重复
项
、
我有一个70 400
的
文件,包含400
行
million+ (JSON)。我
的
最终目标是删除
重复
的
行
,以便我有一个完全“去欺骗”版本
的
文件。我是在一台有8核
和
64 am内存
的
机器上这样做
的
。
对
每个文件进行排序/
Uniq
for X in *; do
sort
-u --parallel=6 $X > sorted/s-$X; don
浏览 0
提问于2018-12-26
得票数 0
4
回答
如何
使用
Linux shell脚本在文本文件中生成唯一
行
列表?
、
、
假设我有一个文件,其中包含一堆
行
,其中一些
重复
:line1line2line3我应该
使用
什么linux命令来生成唯一
行
的
列表:line2line3 如果文件未排序,即
重复
行
可能不在块
中
,这种情况会发生变化吗?
浏览 2
提问于2013-05-31
得票数 14
回答已采纳
3
回答
使用
不带排序(排序)
的
uniq
命令
实际上,我正在编写一个批处理脚本,我需要
使用
批处理代码(这很糟糕)、
uniq
、
sort
、sed等来删除
重复
的
行
,但它不能对进程
中
的
列表进行排序。有什么想法吗?
sort
<file> |
uniq
cat <file> |
uniq
失败
。
浏览 0
提问于2012-11-15
得票数 1
回答已采纳
13
回答
删除vi
中
的
重复
行
?
、
我有一个文本文件,其中包含一个长
的
条目列表(每行一个)。其中有些是
重复
的
,我想知道是否有可能(如果是,如何)删除任何
重复
的
。如果可能的话,我有兴趣在vi/vim内部做这件事。
浏览 9
提问于2008-12-08
得票数 147
回答已采纳
2
回答
使用
awk或sed从多个文件
中
删除
重复
行
、
、
我想知道如何从多个文件
中
消除
重复
行
。我
使用
这个命令获取
重复
行
,但它只显示了相同
的
行
:例如,如果我有以下文件:AAATTTfile1.txt:BBBfile2.tx
浏览 3
提问于2015-09-09
得票数 1
回答已采纳
1
回答
我想清清楚楚地数一下文本文件
中
存在
的
所有单词及其重要性。
我
使用
命令进行单字计数:但我想知道有没有办法把所有的单词都数一遍?所需
的
输出如下所示:I 4groot 8可以
使用
bash文件或bash脚本完成吗
浏览 0
提问于2020-10-20
得票数 2
1
回答
如何将它视为一个整体
的
字符串列表分开
、
我有两个字符串列表,我生成并放入变量,$t
和
$nnpp。然后
使用
comm命令
对
它们进行比较。pcr=$(comm -13 <(echo “$t” |
sort
) <(echo “$nnpp” |
sort
))现在,当我试图遍历我创建
的
$psl
的
新列表
浏览 0
提问于2019-07-24
得票数 2
2
回答
如何找到duplicated[s] line[s]并将其删除?
、
、
、
我不得不在我
的
nrpe.cfg文件
中
添加这一
行
,在200多个服务器
中
:但对于某些问题,有些机器会不止一次地
使用
这一
行
因此,现在我想检查是否有多次,并删除它,只留下一
行
与指定
的
命令。我需要在shell脚本
中
做到这一点。
浏览 0
提问于2013-04-18
得票数 0
回答已采纳
2
回答
是否
使用
sed命令打印
重复
行
?
、
、
我正在尝试
使用
sed命令打印文件
中
的
重复
行
。在一个文件
中
,我有以下内容:hellohow如何
使用
sed命令打印此文件
中
的
重复
行
??hi hello
浏览 2
提问于2015-02-28
得票数 1
3
回答
通过‘`
uniq
-d`查找
重复
匹配
我
的
数据
为/tmp/1910561689480749170406我跑了却什么都没得到这很奇怪,因为
uniq
-d应该 -d Only output lines that are repeated in the input.如何
使用
uniq
-d**?** ?
浏览 6
提问于2009-07-25
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
生信入门系列之Linux入门(二):基础命令(下)
shell编程第七弹-基本文本处理
简单快捷的数据处理,数据科学需要注意的命令行
Linux命令执行顺序控制与管道、cut、grep、wc、sort
老掉牙的Linux uniq还能这么玩儿!网友:以前都白学了!
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券