我正在寻找算法,可以告诉我文本的语言(例如,你好-英语,Bonjour -法语,Servicio -西班牙语),并纠正英文单词的打字错误。我已经探索了谷歌的TextBlob,它是非常相关的,但它得到了“太多的请求”的错误,只要我的代码开始执行。我也开始探索Polyglot,但我在Windows上下载这个库时遇到了很多问题。TextBlob的代码from tkinter im
我得到的输出是:怎样才能最好地将措辞安排成恰当的英语句子:Hello how are you ?我对整个自然语言处理是陌生的,所以我不熟悉许多术语。我能想到的唯一办法就是--用语句来确定:adverb - verb - noun,然后根据这些语句重新排列它们?注意:让我们假设我正在尝试形成适当的问题,所以忽略确定它是一个问题还是一个陈述。
我有理由这样做:在一种情况下,我不想在删除停止词之前进行标记,因为这会导致许多无用的bigram,而在另一种情况下,我必须用特定语言的过程预处理文本。例如,注意ie2010语料库中的"\n“texts(text.corpus)[1] # Use texts() to extrapolateIt is of e
关于为什么一个人可能更喜欢预处理的原因的进一步说明。我现在的