我对如何将任何文本解析成有效的句子有疑问。My approach: I solved this using Dynamic programmnig, formula is T[i] = 1 iff T[j] = 1 and substring(j+1, i) is a word in dictionary f
我正在做一个自然语言处理项目(在C#中),我需要通过它们的索引来引用单词,而不是字符串本身来加快速度。例如,句子"i am what i am"应该存储为"0 1 2 0 1"。然而,这会带来麻烦,因为我需要有几个Codebook用于不同的用途(例如,一个用于中文,一个用于英语,甚至还有一个用于词性标签),所以我想了另一种方法。这样,几乎每个处理句子的方法都有一个Codebook参数。因为在C#中,传递对象是以引用的形式,而不是它的实际内容,所以所有出现的Codebook对象都引用同