我正在做一个NLP项目,我想搜索文本语料库,试图找到给定动词-宾语对的频率。
目的是找出当给出几种不同的可能性时,哪种动词-宾语对最有可能。例如,如果给定字符串"Swing the stick“和"Eat the stick”,我希望语料库能显示出,某人更有可能挥舞一根棍子,而不是吃一根。我一直在阅读关于n-gram和语料库语言学的文章,但我正在努力寻找一些使用Java执行这种类型的搜索的方法,有没有可能有用的API?
我试图建立一个基于张量流和Keras的股票价格预测的LSTM模型。所以我试着在我的木星笔记本上安装张量流和角。我使用的是2020 MacBook Air M1。但是当我试图在我的木星笔记本中输入张量流时,我无法做到这一点。
然后,我试图安装张量流和角直接进入木星笔记本通过以下代码。import Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.layer
我很想知道在调用Gensim build_vocab和train of Gensim FastText模型时使用不同的源是否有任何含义。这会影响单词嵌入的上下文表示吗?我这样做的目的是,有一组特定的词,我感兴趣的是获得向量表示和调用model.wv.most_similar时。我只希望在这个词汇列表中定义的单词被返回,而不是在训练语料库中所有可能的单词。