我尝试将一个公共txt文件加载到Pandas中的dataframe中,以便稍后以德语执行名称实体识别。原始的txt文件有结构# word日期,后面跟着一个数字(句子中的位置),一个单词和名称实体识别,单词与Tabs分开。所以结构是:
text [21-03-1991] 1 Aufgrund O O 2 des O O # text [22-04-1993] 1 Aber O P
有没有人知道我怎样才能把它变成这样的格式:
Aufgrund 0 0
des 0 0
Aber O P
最好的情况下每一个#在一个新的专栏?
我想用
pd.read_csv(...)
我们的任务是识别下一个代码中的问题:
ORG 0000H
MAIN:
CLR A
MOV A, FFFFH
MOV B, FFH
AGAIN: DEC A
DJNZ B, AGAIN
END
在MOV A, FFFFH和MOV B, FFH EdSim51上
FFFFH和FFH上的未知标签。
我对这种类型的代码没有任何经验。我想这是关于每个寄存器的位数,但我不确定。有人能给我解释一下吗。
我有以下表达式:[^(\r\n)]*来识别任何不包含\r\n的文本。但是,当文本包含(或)时,则无法识别。
示例:
"I have following expression to recognize any text."将被确认为OK。
"I have following expression (A) to recognize any text."将不被识别。
因此,我想要全文:"I have following expression (A) to recognize any text."
这个yaml工作:
-
test: >
long
此yaml不:
-
test: >
long
test
text
--这不起作用:
-
test: >
"long
test
text"
我怎样才能把它变成多行?这个问题以前已经回答过了,但我认为没有在次级层面上回答。
我必须缩进最后一行吗?
我使用这个服务来测试它: