腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
SQL
Server
中
计算
余弦
相似
度
的
优化
方法
、
、
我想比较任意两个in在多个维度上
的
不同向量(即,向量
中
的
组件数量)。为此,我
计算
余弦
相似
度
。为此,我为我
的
数据集中
的
每个id提供了一个向量列表。values (1234,2,5);insert into data values (1234,4,3); 但是在我
的
表
中
这会产生一个非常非常大
的
表。为了<e
浏览 80
提问于2021-06-28
得票数 1
回答已采纳
1
回答
余弦
相似
度
的
Pandas到
SQL
Server
列限制
、
、
、
我正在使用NLTK
计算
余弦
相似
度
,并将
余弦
相似
度
值导出到
SQL
Server
,我想将其用于其他报告目的。 我有大约4773列,大约2k行,而
SQL
Server
不支持这些列数?什么会是更好
的
选择?我有两个数据集,我称之为训练集(2k文档)和测试数据集(4773个文档),在这个过程
中
,所有的测试数据记录都将变成列,大约有4773列,这是
SQl
服务器
浏览 4
提问于2016-12-10
得票数 0
2
回答
修正
的
余弦
相似
效率
、
、
、
、
问题所在 我试图
计算
两个数组之间
的
余弦
相似
度
,但基本公式略有变化。也就是说,我只关心与“引用”数组重叠
的
组件。例如,B
中
的
第一行是[1 1 0],所以
相似
度
计算
使用修改后
的
A矩阵: [1 0 0][0
浏览 28
提问于2019-10-15
得票数 0
回答已采纳
1
回答
使用tensorflow获取负
余弦
距离
、
、
我正在使用tf.losses.cosine_distance(Y, outputs, axis=2, reduction=tf.losses.Reduction.MEAN)来衡量我
的
标签和预测之间
的
差异在我
的
例子
中
,预测
的
形状是[16311, 20, 100]。----------------------epoch5----------------------
余弦<
浏览 0
提问于2019-05-29
得票数 1
1
回答
句子转换器如何预测新实例
、
、
、
、
它展示了如何对我们
的
自定义数据进行培训。但我不知道该怎么预测。如果有两个新句子,如1)这是第三个例子,2)这是第三个例子。我怎么能预测到这些句子有多
相似
呢?train_examples, shuffle=True, batch_size=16)保存了与旧代码相比
的
modelexample sentence", "Each sentence is converted"] model_new.encode(senten
浏览 1
提问于2022-01-04
得票数 2
1
回答
生成两个具有给定角度
的
向量
、
、
、
我试图用给定
的
余弦
相似
度
生成两个向量。输入将是
余弦
相似
度
的
程度(或者说它取决于它)和向量
中
的
维数(D),输出将是D维
的
两个向量,与它们之间给定
的
相似
度
,现在我知道如何使用
余弦
相似
函数来
计算
相似
度
,但当我尝试相反
的
方法
时,我
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
3
回答
最佳简历,文档匹配
、
、
、
、
我用了三种不同
的
方法
来
计算
简历和工作描述之间
的
匹配。有人能告诉我什么
方法
是最好
的
吗?为什么? Gensim库采用LSA/LSI模型提取关键词,
计算
文档与查询之间
浏览 4
提问于2016-11-02
得票数 1
1
回答
仅对于匹配
的
文档,与Lucene
的
余弦
相似
性
、
、
、
与将查询与每个文档进行比较
的
天真
方法
相比,(即使是那些没有提到查询
中
存在
的
任何令牌
的
文档),这是一个很大
的
好处。这是正确
的
吗? 现在,我试图
计算
文档之间
的
余弦
相似
度
。输入查询将是一个文档,输出应该是
余弦
分数。它是介于0到1之间
的
一个数字。我已经读过一些
计算
余弦
相似
度
的
浏览 5
提问于2015-09-07
得票数 1
回答已采纳
1
回答
与BigQuery
SQL
的
余弦
相似
性?
、
、
我将向量存储在BigQuery (请参阅)
中
,我希望找到它们之间最
相似
的向量。如何用BigQuery标准
SQL
计算
余弦
相似
度
?
浏览 0
提问于2017-12-04
得票数 4
1
回答
我们如何
计算
由评级表示
的
两个项目的调整后
的
余弦
相似
度
?
、
、
、
我想分别为a和b表示
的
两个项目
计算
调整后
的
余弦
相似
值。我们取两个向量a={2,3,1,0}和b={1,0,4,2}。我知道
余弦
相似
度
是如何工作
的
,但我坚持使用调整后
的
余弦
相似
度
方法
。
浏览 4
提问于2016-02-18
得票数 0
2
回答
python手套
相似
性度量
计算
、
、
我正在尝试理解python如何
计算
most-similar术语。我知道,从gensim
的
word2vec
中
,most_similar
方法
用
余弦
距离来
计算
相似
度
。
浏览 1
提问于2016-10-31
得票数 4
回答已采纳
1
回答
Elasticsearch:在相关评分中使用密集向量上
的
距离(在查询时)
我使用elasticsearch来组合不同
的
东西:-基于密集向量(
余弦
相似
度
)
的
文本得分搜索。我
的
问题是,在查询阶段不
计算
余弦
相似
度
,我在文本
中
的
搜索充当预筛选器。我
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
如何用Lucene和Java
计算
tf-国防军
的
余弦
相似
度
、
、
、
我需要根据与tf-国防军
的
余弦
相似
性对这些文件进行排序。请有人告诉我,我能从Lucene那里得到什么支持来
计算
这个?从Lucene可以直接
计算
出哪些参数(可以通过lucene
中
的
某些
方法
直接得到tf、国防军吗?)如何用Lucene
计算
余弦
相似
度
(如果传递查询和文档
的
两个向量,是否有直接返回
余弦
相似
度
的<
浏览 1
提问于2012-04-16
得票数 2
2
回答
Scipy Python
中
的
高效并行稀疏矩阵点积
、
、
、
、
我有一个非常大(1.5M x 16M)
的
稀疏csr scipy矩阵A。我需要
计算
的
是每对行
的
相似
度
。= 0*1 + 1*0 + 0*2 + 4*3 = 12AT = np.transpose(A)现在pairsi,j是行i和行j
的
相似</em
浏览 2
提问于2015-01-28
得票数 2
1
回答
用word2vec,doc2vec
计算
两个文档之间
的
相似
度
、
、
、
、
我正在试图
计算
两个文档之间
的
相似
性,这两个文档由数千个句子组成。但是,我想捕捉文档之间更多
的
语义差异。因此,我通过简单地平均每个文档
中
的
所有单词向量,生成文档向量,并度量这些文档向量之间
的
余弦
相似
度
,从而构建了文档嵌入和
计算
文档
相似
度
。然而,由于每个输入文档<e
浏览 0
提问于2018-11-25
得票数 2
回答已采纳
1
回答
如何
计算
TF-IDF
、
我想使用TF-IDF
的
余弦
相似
度
方法
来得到两个单词
的
语义
相似
度
。首先,我想从wikipedia或word- text中提取这些单词
的
含义,然后对文本进行预处理并找到TF-IDF。在我
的
例子
中
,哪个是训练集,哪个是测试集?如何使用
计算
结果
计算
余弦
相似
度
?
浏览 3
提问于2012-10-06
得票数 1
回答已采纳
1
回答
余弦
相似
度
影响
、
、
我正在
计算
余弦
相似
度
,以了解一些年度趋势,我很好奇是否有一种
方法
可以看到哪些值对
相似
度
贡献最大?是否有一种影响力
计算
或
方法
用于单词列表(我认为这将是最
相似
的应用程序),可以说列表
中
的
哪些单词对
相似
度
得分贡献最大?
浏览 21
提问于2021-07-20
得票数 0
回答已采纳
1
回答
关于word2vec most_similar()函数
、
、
我使用如下
的
most_similar()
方法
来获取与给定单词
相似
的所有单词:AFAIK,它
的
作用是
计算
给定单词和字典中所有其他单词之间
的
余弦
相似
度
。当我检查单词和分数时,我可以看到列表中有负分数
的
单词。这是什么意思?它们是与给定单词具有相反含义
的
单词吗? 另外,如果它
浏览 2
提问于2016-01-19
得票数 5
1
回答
在gensim文档
相似
度
中
,是否可以用Jaccard
相似
代替
余弦
相似
度
?
、
、
、
、
我使用gensim库来
计算
文档间
的
相似
度
,但它只使用
余弦
相似
度
。我想知道是否有一种
方法
可以用jaccard
相似
性或者其他
相似
性度量来代替。
浏览 0
提问于2016-12-20
得票数 2
2
回答
可以仅使用非空值在行之间使用
余弦
相似
性吗?
、
、
我想要找到一个查询行和另外10个行之间
的
余弦
相似
度
(或者欧几里得距离,如果更容易)。这些行都是nan值,因此如果列是nan,则忽略它们。因此,我只想得到查询
的
每个非空列与df列
中
的
行之间
的
余弦
相似
性。因此,对于df
中
的
第0行,B和F在查询和df中都是非空
的
。
浏览 0
提问于2019-02-11
得票数 5
回答已采纳
点击加载更多
相关
资讯
自然语言处理中句子相似度计算的几种方法
四种计算文本相似度的方法对比
烽火软件申请一种基于Spark SQL的笛卡儿积Join优化方法专利,提升Spark SQL集群总体的计算效率
大数据Mahout中相似度的几种算法介绍,内含Mahout相关资料
NLP中的嵌入和距离度量
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券