我有一个几百行长的大文件。这个文件被一个特定的标识符分割成许多部分,比如'ABC‘。这一行'ABC‘出现6次,所以我想要6个输出文件。我熟悉split和awk,但似乎无法创建一个命令行来执行我所描述的任何想法?
下面是一个例子
ABC
line 1
line 2
line 3
ABC
line 1
line 2
ABC
line1
我想要三个文件,其中ABC是新文件的第一行,在遇到下一个ABC之前结束。
我正在读一个csv文件,这是相当混乱的。看起来像tt。
a <- c("REQDO.,TRIBUNAL DE JUSTIÇA DO ESTADO DO RIO GRANDE DO SUL ,")
b <- c("29/05/1992 ,PUBLICADO ACORDAO DJ: , , , ,")
c <- c("23/04/1991 ,DECISAO PUBLICADA DJ: , , ")
d <- c(&
我的目录中几乎有1000个html文件。每个文件需要根据反复出现的模式(标题)分成多个文本文件。我在一台windows机器上,使用GnuWin32工具。
对于一个文件,我找到了一种方法来做到这一点:
csplit 1.html -b "%04d.txt" /"Words in heading"/ {*}
但是我不知道如何在整个HTML文件上重复这个操作。这是:
csplit *.html -b "%04d.txt" /"Words in heading"/ {*}
不起作用,这也不行:
for %i in (*.html) do
我有一个有很多行的列表,它的形式如下所示
Peter,Sam,Andrew a,b,c,d
Anna,Susan,Sandra,Annie e,f,g
我想把它转换成这样的列表
Peter a
Peter b
Peter c
Peter d
Sam a
Sam b
Sam c
Sam d
...
Annie e
Annie f
Annie g
我怎么能这么做?我在行上尝试了一个for循环,并使用strsplit函数将它们分开,然后我想将它们组合在一起,但是我失败了,出现了错误,无法继续。
我有以下输出:
Column1
1.2.3.1
1.2.3.2
1.2.3.3
1.2.3.4
1.2.3.5
1.2.3.6
Column2
1.2.3.7
1.2.3.8
1.2.3.9
I would like to split into 2 columns once it reaches Column2.
For example:
Column1 Column2
1.2.3.1 1.2.3.7
1.2.3.2 1.2.3.8
1.2.3.3 1.2.3.9
1.2.3.4
1.2.3.5
1.2.3.6
我试过"pr -2 -t“,但
当我试图从JavaScript中的GET获取纬度和经度信息时,我得到了(NaN, NaN)。下面是我的代码:
var GET = {};
var params = location.search.substr(1).split("&");
for (var i=0; i < params.length; i++) {
var par = params[i].split('=');
GET[par[0]] = par[1];
}
function initialize() {
var latitude_longitude =
我是Unix实用程序的新手,但是我尝试学习一些新的东西,并尝试将我简单的ruby脚本转换成某种shell脚本来做同样的事情。但我不知道该怎么处理这个任务。
我需要拆分一个包含几个小对象的大文件。每个对象都以如下行开头:OBJECT Type Number Name。
当我使用Ruby时,我正在遍历文件行,如果我找到了模式,就开始将行转储到文件中。直到我再次找到这个模式。
完成后,我将收到一堆较小的文件,而不是一个大的。
但是使用shell脚本和Unix实用程序可以做同样的事情吗?grep,sed.不调用perl,ruby
编辑:我正在开发定制的git命令并使用。因此,只有msysgit附带的实
我在这个问题上有困难。
df <- data.frame(number=1:3,name=c('a','b','c'),code=c("5464","5463,5678","45363,6346,6435"))
如果第三列只有一组数字,不要重复。对于大于1组的数字,重复行并用后面的数字替换。
原始输出
number name code
1 a "5464"
2 b "5463,5678"
3
我听说这个论坛以回答最疯狂的问题而令人惊叹,我到处搜索我疯狂的问题的答案,但我找不到答案。因此,我将这一点发布给社区。
我使用PowerShell来满足我的脚本需求。请不要给我提供另一种脚本语言的解决方案,我相信其他脚本语言可以做到这一点,但我需要在PowerShell中这样做。
我有许多需要拆分的字符串,它们在本质上类似于:
HelloWorld
HelloWorldIAmNew
HelloWorldIAmNewToScripting
ThankYouForHelpingMe
我需要根据大写字母来拆分它们。
Hello World
Hello World I Am New
Hello Wor
我在R上有这个数据框:
id value
1 "i want it"
2 "you hate me"
3 " they know"
由id标识的==>3注释
现在我想拆分评论,但保留每个单词的id:
id word
1 i
1 want
1 it
2 you
2 hate
2 me
3 they
3 Know
我试着用split,sapply...但是我不知道我该怎么做。有人能帮我吗?
感谢您的帮助
很抱歉可能会有重复,但我甚至无法用文字描述我想得到的东西。
下面是我现在要做的事情(列表)
id1 one; two; three
id2 one
id3 one; two; three; four
id4 one; two
我需要得到的
id1 one
id1 two
id1 three
id2 one
id3 one
所以..。帮助。我需要这样才能从Blast2GO检索ID表创建UniProt自定义的.annot文件。
我有一些大的文本文件。内容如下:
Begin to work
Load library
Start
TEXTLOG
Checking
ok
TEXTLOG
Start process
Starting node
ok
TEXTLOG
Stop node
TEXTLOG
在这个文件中,"TEXTLOG“行用作标记,因此我希望将该文件拆分为几个较小的文件,使用"TEXTLOG”作为EOF指示符,因此我应该:
file1:
Begin to work
Load library
Start
file2:
Checking
ok
file3:
Start process
Starting
我想按正则表达式分割文件,我有如下文件格式
0|t| lorem ...
some text
138|t| title
some text
如果我执行egrep "[0-9]+\|t\|" file | wc -l,它会正确地计数发生情况,但是如果我执行csplit filename /[0-9]+\|t\|/,它就表示没有找到匹配,也没有拆分文件。
似乎有些问题的管道在模式,但无法找到解决办法。