我正在探索句子转换器,并偶然发现了这个。它展示了如何对我们的自定义数据进行培训。但我不知道该怎么预测。如果有两个新句子,如1)这是第三个例子,2)这是第三个例子。我怎么能预测到这些句子有多相似呢?is an example sentence", "Each sentence is converted"]问题1)
这是一种在训练旧模型和创建新模型之后获得句子嵌入的正确方法吗我很困惑,因为在拟合过程中,我们给出了两个<em
我的数据框架中有一个文本列,其中包含(S)段,在数据帧的每个实例/示例/行中都有多个可变的句子。然后,我使用nltk的sent_tokenizer创建了该段的句子标记,并将其放入另一列。"My name is xx", "I have a cat", "Love is life"] 0
现在当我使用embeddings = model.e