有没有办法在scikit-learn库中实现skip-gram?我手动生成了一个带有n-skip-gram的列表,并将其作为CountVectorizer()方法的词汇表传递给skipgrams。有没有更好的方法在scikit learn中实现跳过语法?text from file as a list
# this one returns a k-skip n-gram
我正在学习NLP,并学习如何使用NLTK和scikit-learn进行文本分类。因此,我在NLTK的movie_review语料库中实现了Unigram presence功能。现在,我正在尝试实现一篇研究论文,其中他们使用了多种功能:2.: Ratios No. of spelling errors : Real-valued feature Length of te