为什么两个向量之间的余弦相似性是负的？ - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

关于word2vec most_similar()函数

text-mining、gensim、word2vec

我使用如下的most_similar()方法来获取与给定单词相似的所有单词：AFAIK，它的作用是计算给定单词和字典中所有其他单词之间的余弦相似度。当我检查单词和分数时，我可以看到列表中有负分数的单词。这是什么意思？它们是与给定单词具有相反含义的单词吗？另外，如果它使用余弦相似度，它

浏览 2提问于2016-01-19得票数 5

1回答

当我使用余弦相似度时，为什么我得到的邓恩指数是负值？

matlab、cluster-analysis、distance、cosine-similarity

我使用了不同的相似度矩阵，如欧几里得、曼哈顿和余弦，当我使用余弦相似度时，Dunn指数为负值。我读到过邓恩指数的取值范围从0到无穷大。使用余弦相似度计算Dunn指数是正确的吗？

浏览 94提问于2019-06-12得票数 1

回答已采纳

1回答

word2vec的余弦相似性大于1

python、apache-spark、pyspark

浏览 0提问于2016-12-29得票数 6

4回答

向量空间模型:余弦相似度与欧氏距离

vector、distance、euclidean-distance、trigonometry

我有机密文本的语料库。通过这些，我创造了向量。每个向量对应于一个文档。向量分量是本文档中的字权值，以TFIDF值计算。接下来，我建立了一个模型，其中每个类都是由一个向量表示的。模型中的向量和语料库中的类一样多。模型向量的分量计算为该类中从向量中提取的所有分量值的平均值。对于非分类向量，我通过计

浏览 0提问于2013-10-16得票数 40

回答已采纳

1回答

余弦相似度与余弦距离的区别

python、scikit-learn、scipy、cosine-similarity

它看起来像scipy.spatial.distance.cdist余弦相似距离：不同于sklearn.metrics.pairwise.cosine_similarity，后者是有人知道为什么会有不同的定义吗？

浏览 1提问于2019-10-15得票数 13

回答已采纳

2回答

为什么word2Vec使用余弦相似度？

nlp、deep-learning、word2vec

我一直在阅读关于Word2Vec的论文(例如)，我认为我理解训练向量以最大化在相同上下文中发现其他词的可能性。例如，对于文档来说，余弦相似性比较是有意义的

浏览 4提问于2016-07-17得票数 17

回答已采纳

1回答

gensim similar_by_word函数的相似度是多少？

gensim

基因similar_by_word函数的相似性是多少？similar_by_word函数返回一个序列(word，相似性)。这里的相似性定义是什么?它是如何计算的？

浏览 0提问于2019-02-11得票数 0

回答已采纳

1回答

tf-以色列国防军不同长度的文件

python、normalization、tf-idf、textblob

当文档长度非常不同时(例如，文档长度从500字到2500字不等)，我搜索了关于规范tf等级的网页。我发现的唯一的规范化讨论是将术语频率除以文档的长度，从而导致文档的长度没有任何意义。但是，这种方法对tf的规范化来说是非常糟糕的方法。如果有的话，这会导致每个文档的tf等级有很大的偏差(除非所有文档都是从几乎相同的字典中构造的，而使用tf-国防军时则不是这样)。例如，让我们拿

浏览 2提问于2016-09-26得票数 10

回答已采纳

1回答

如何获得与自动编码器的相似性？

deep-learning、similarity、autoencoder

我已经建立了一个自动编码器从一个非常高的维度(200维)空间提取一个更小但重要的表示(16个维度)。现在我有了这些“编码”向量，我想要计算某种相似的分数，或者聚类。

浏览 0提问于2019-07-08得票数 1

回答已采纳

1回答

余弦相似-缺点作为推荐引擎？

neo4j、machine-learning、knn、recommendation-engine、cosine-similarity

我见过在K-最近邻算法中使用余弦相似性来生成基于用户偏好的推荐。在这些模型中，将给定产品的用户等级作为向量，然后由两个向量之间的余弦相似度来确定两个用户之间的相似度。(例如) 我的问题是：能解释使用Cosine相似性的推荐引擎是如何计算出并行用户偏好的吗?在

浏览 2提问于2014-10-07得票数 1

回答已采纳

1回答

搜索引擎中查询与文档的余弦相似度

nlp、ranking、information-retrieval、cosine-similarity、ranking-functions

我正在翻阅曼宁的情报检索书。目前我在关于余弦相似性的部分。有一件事我不清楚。这里有一个例子:我们有用户查询“猫食

浏览 1提问于2017-11-05得票数 1

1回答

是否标准化word向量和文档向量之间的相似性？

vector、compare、similarity、word2vec、doc2vec

余弦相似度被广泛用于度量两个向量之间的相似性，其中两个向量可以是单词向量或文档向量。。当

浏览 2提问于2018-05-15得票数 0

1回答

匹配2个文本文档的最佳方法

tf-idf、textmatching

我试着制作这样一个软件，使两个文本文档智能地类似于检查文本匹配的程度，而不像DIFF，我在Google上搜索了一个相当多的东西，我发现了两个东西，就是Graph&TF下手。

浏览 2提问于2015-01-06得票数 0

回答已采纳

1回答

在没有方向的情况下，如何利用文档特征向量上的余弦相似度公式？

classification、vector-space-models

在数学中，向量具有大小和方向。然而，余弦公式仅适用于向量。一个矢量应该有两个震级和方向。对于表示为向量的文档，方向在哪里？

浏览 0提问于2020-05-17得票数 1

1回答

潜在语义分析如何处理语义

nlp、latent-semantic-analysis

但我不明白它在LSA是如何运作的。有人能告诉我LSA是如何处理语义的吗。

浏览 5提问于2014-08-15得票数 1

回答已采纳

1回答

为什么在gensim doc2vec中单词或文档向量之间几乎所有的余弦相似点都是正的？

python、gensim、word2vec、doc2vec

我使用gensim中的Doc2Vec.docvecs.similarity()计算了文档的相似性。现在，如果gensim使用余弦的绝对值作为相似性度量，我希望余弦相似性在0.0，1.0之间，或者如果不使用，大约有一半是负的。然而，我看到的是，有些相似之处是负面的，但它们是非常罕见的--在我的3

浏览 6提问于2017-06-03得票数 3

回答已采纳

2回答

在求余弦相似性时，非额定场的值应该是多少？

correlation、recommender-system、cosine-distance

我正在研究一个非常基本的图书推荐系统。我想知道在找到余弦相似性时，用户没有给它们打分的字段该如何处理，我们应该忽略它们，只用赋值字段计算，或者标记它们为0。我所遵循的书说，排除字段，因为它会给出错误的解释，在欧几里德和皮尔逊相关的情况下，但在余弦相似的情况下，它使所有的非额定场为0。有人能解释为什么只对于余弦而不是其他人需要将未分级的字段设置为0，或者有不同的方法来做到这一点。(我

浏览 0提问于2016-06-12得票数 8

1回答

计算2行向量的cos相似性，并不是所有成对的cdists

python、scikit-learn、cosine-similarity

我有两个熊猫df触发器和动作，其中包含25维的特征向量写入行，并希望在相应的行之间的余弦相似性。下面的代码生成成对余弦相似性的20675 x 20675矩阵：(20675, 25)(20675, 25)result = cdist(trigger, action, metri

浏览 1提问于2018-04-15得票数 0

回答已采纳

2回答

使用相同源的余弦相似和完全不同的结果

python、machine-learning、cosine-similarity、word-embedding、machine-translation

我正在学习单词嵌入和余弦相似性。我的数据是由两组相同的词组成的，但用的是两种不同的语言。我是否应该期望获得同样的结果？我注意到有时我有<e

浏览 3提问于2019-07-24得票数 0

回答已采纳

1回答

当与其他向量比较时，确定向量中的每个元素对余弦相似性的贡献。

feature-selection、cosine-distance、siamese-networks

我有一个向量，表示我的对象，并通过使用余弦相似性来计算哪个对象与另一个对象相似。a = [1,2,3,4,5,6]我的问题是：如何确定向量中需要哪些特征我需要这个结果来找出我需要在向量中包

浏览 0提问于2022-12-23得票数 0

点击加载更多

关于word2vec most_similar()函数

当我使用余弦相似度时，为什么我得到的邓恩指数是负值？

word2vec的余弦相似性大于1

向量空间模型:余弦相似度与欧氏距离

余弦相似度与余弦距离的区别

为什么word2Vec使用余弦相似度？

gensim similar_by_word函数的相似度是多少？

tf-以色列国防军不同长度的文件

如何获得与自动编码器的相似性？

余弦相似-缺点作为推荐引擎？

搜索引擎中查询与文档的余弦相似度

是否标准化word向量和文档向量之间的相似性？

匹配2个文本文档的最佳方法

在没有方向的情况下，如何利用文档特征向量上的余弦相似度公式？

潜在语义分析如何处理语义

为什么在gensim doc2vec中单词或文档向量之间几乎所有的余弦相似点都是正的？

在求余弦相似性时，非额定场的值应该是多少？

计算2行向量的cos相似性，并不是所有成对的cdists

使用相同源的余弦相似和完全不同的结果

当与其他向量比较时，确定向量中的每个元素对余弦相似性的贡献。

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐