我尝试将一个公共txt文件加载到Pandas中的dataframe中,以便稍后以德语执行名称实体识别。原始的txt文件有结构# word日期,后面跟着一个数字(句子中的位置),一个单词和名称实体识别,单词与Tabs分开。所以结构是:
text [21-03-1991] 1 Aufgrund O O 2 des O O # text [22-04-1993] 1 Aber O P
有没有人知道我怎样才能把它变成这样的格式:
Aufgrund 0 0
des 0 0
Aber O P
最好的情况下每一个#在一个新的专栏?
我想用
pd.read_csv(...)