腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2220)
视频
沙龙
2
回答
基于
相似性
度量
(
例如
,
余弦
相似性
等
)
对
Holoviews
热
图
的
列
和
行
进行
重新
排序
。
、
、
、
、
令我惊讶
的
是,似乎从来没有人问过这个问题。假设我有一个pandas数据帧(随机示例),我可以得到一个带有
Holoviews
和
Bokeh渲染器
的
热
图
: rownames = 'ABCDEFGHIJKLMNO' df = pd.DataFrame(数据(x
和
y)是分类
的
,因此行或
列
的
初始顺序并不重要。我想根据一些
相似性
度量
对
行
浏览 44
提问于2019-03-22
得票数 2
回答已采纳
2
回答
使用python聚类/查找类似的
热
图
、
、
、
、
我有以下
热
图
的
示例图像(我现在有数百个这样
的
images...for,以后会增长): 用我的人眼,我会说heatmap1,3
和
4是相似的,或者3
和
4是最相似的,我不确定我希望能够根据模式
和
强度将最相似的
热
图
图
划分成不同
的
组。
例如
,中
的
每个heatmap包含24
行
和
5
列
(
浏览 10
提问于2017-05-11
得票数 0
1
回答
如何在MALLET中获取两个文档之间
的
余弦
相似度?
、
、
、
我有一个使用MALLET训练
的
LDA主题模型,但是我想计算两个文档之间
的
余弦
相似度来获得相似度,但是我不确定我要计算哪个文件
的
余弦
。我
的
余弦
相似度函数运行得很好,但我不确定我在MALLET中比较
的
是什么。 任何帮助都将不胜感激!
浏览 1
提问于2017-04-07
得票数 0
5
回答
余弦
相似度与点积
的
距离
度量
看起来,两个特征
的
余弦
相似性
仅仅是它们
的
点乘积,它们
的
大小
的
乘积。
余弦
相似性
是什么时候比点积更好
的
距离
度量
?也就是说,在不同
的
情况下,圆点乘积
和
余弦
相似性
是否有不同
的
优缺点?
浏览 0
提问于2014-07-15
得票数 80
回答已采纳
1
回答
什么是文档向量中
的
“信息”使情感预测工作?
、
、
、
、
基于
文档向量
的
情感预测效果很好,
例如
: 随机初始化一个固定
的
“比较”向量,得到训练
和
测试集中“比较”向量与所有其他向量
的
余弦
相似度,利用训练集
的
相似性
和
标记来估计一
浏览 5
提问于2017-06-01
得票数 1
回答已采纳
1
回答
R中数据重叠
的
最佳方法
、
、
、
如果我有一组对象,其中有些共享某些离散属性(
例如
,A、B、C、D设置为1或0),我如何在数据集中可视化这些属性
的
覆盖
和
重叠?
例如
: 1 34 1 0 0 1 3 14 0 0 1 1我主要是使用R,并尝试了一些Venn
图
包,但这并不是真正可扩展
的
过去
的
5个维度。
浏览 5
提问于2013-12-18
得票数 3
回答已采纳
1
回答
如何将文本
和
分类数据混合在一起
的
数据
进行
聚类?
、
、
、
我有一组字符串,每个字符串都有与之相关
的
分类信息。但是,分类信息并不总是很好,所以我需要根据文本内容
和
类别对消息
进行
聚类。做这件事最好
的
方法是什么?
浏览 0
提问于2015-05-18
得票数 3
1
回答
问答比较多句使用
、
希望从用户那里获取答案文本,并将其与正确
的
答案
进行
比较。我想把它放在关键词/流行语
和
反应
的
一般准确性上。我是一名移动开发人员,不是一名数据科学家,也不是一位精通机器学习的人,所以我有点迷失在这里,不知道我是否走上了正确
的
道路。 我一直在研究自然语言过程
和
一些相关
的
python库/模型来评估句子。我朝正确
的
方向走了吗?还是我该换个办法?
浏览 0
提问于2020-05-13
得票数 2
2
回答
如何根据数据集中两个特征
的
分布
对
它们
的
相关性
进行
排序
?
、
、
假设我们得到了一个数据集,并希望根据分布
的
相似性
对
它们
进行
排序
。我不想用视觉化。有什么足够
的
方法和我分享吗?我有一个想法,比如,我们可以从特征中减去一些百分位数,然后找出它
的
平均值。
浏览 0
提问于2023-05-27
得票数 0
4
回答
使用Microsoft Cognitive Services查找相似项目
是最好
的
,也是最少
的
工作,用来解决查找给定文章
的
相似文章
的
问题。文章是一串文本。假设我没有关于文章
的
用户交互数据。
浏览 2
提问于2016-07-01
得票数 0
1
回答
比较多元时间序列间
的
重要性/数据模式
、
、
我有一个简单
的
多变量时间序列,每一
列
都可以在下面的线状图中绘制,我
的
问题是,是否有任何算法或机器学习优先
排序
三
列
根据数据或图表每周?因为每一
列
代表一个
度量
(A
度量
、B
度量
和
C
度量
),所以我想知道
基于
数据而没有任何领域知识
的
重要性,并给出每个领域
的
排名。相似的特征重要性,但没有相应
的
反应。
例如
,A-1
浏览 0
提问于2022-08-20
得票数 2
2
回答
计算单个搜索查询之间距离
的
标准方法是什么?
、
、
我提出了一个类似的问题,询问“文档”(维基百科文章、新闻报道
等
)之间
的
距离。我把这作为一个单独
的
问题,因为搜索查询比文档小得多,而且噪音很大。因此,我不知道(并怀疑)是否会在这里使用相同
的
距离
度量
。无论是普通
的
词汇距离
度量
还是最先进
的
语义距离
度量
都是首选
的
,
对
后者有更强
的
偏好。
浏览 0
提问于2014-07-05
得票数 8
回答已采纳
2
回答
函数在R中
的
数据帧列表中
的
应用
、
、
、
我有一个数据帧列表,每个数据帧都有一个三维向量(3
列
)
的
行
。我想计算每个数据帧(
例如
,第1
行
和
第2
行
、第2
行
和
第3
行
、第3
行
、第3
行
和
第4
行
等
)
的
每一
对
后续
行
的
余弦
相似性
(lsa:: cosine )。我如何循环遍历列表中
浏览 3
提问于2022-08-17
得票数 2
回答已采纳
2
回答
如何比较文本聚类中
的
不同
相似性
度量
?
、
、
、
我有一个包含从字幕生成
的
向量
的
数据集(每一
列
代表一种类型,每行代表一个电影名称),我
的
目的是找到最相似的电影标题,我想使用不同
的
距离/
相似性
度量
并比较它们,最好
的
方法是什么?现在,我尝试了L1距离,
余弦
相似度,欧几里德距离,马氏距离,我得到了前n个最相似标题
的
结果,但是所有的结果看起来都很合理,如何比较哪种方法效果最好呢?还有关于其他
相似性
度量
的
建议吗?
浏览 0
提问于2019-07-30
得票数 6
回答已采纳
1
回答
向量索引
的
余弦
相似度及其加权
、
、
、
我
对
NLP非常陌生,虽然这似乎是一个基本
的
问题,但我不知道如何在网上搜索答案。📷我需要使用什么方法来提取关键字级别之间
的
相似性
?我想找出两个文本是如何相似的基础上,它包含了哪些关键字
和
这些关键字
的
排名。我尝试了
余弦
<e
浏览 0
提问于2020-12-12
得票数 2
2
回答
运行K-均值聚类后寻找最佳聚类
、
我有一堆文本,我想根据语义
相似性
进行
分类。通过K-方法,我能够将完整
的
文本划分成不同
的
簇。第1组:- 第2组:- “人们更有可能避免吸烟,如果他们.”。集群1应该排在第2组
的
前面,因为它在包含在其中
的
文本之间具有更大
的</em
浏览 0
提问于2018-07-30
得票数 1
1
回答
基于
关键字
的
类别选择方法
、
、
我想给一组关键字分配一个特定
的
类别。因此,人们可以上传图片或视频,当他们这样做时,他们可以设置关键字。这些关键字可以自由键入,这样单词就可以以不同
的
方式拼写。关键词数量在0~20个字之间占95%。这样我就可以将关键字
的
组合分配给一个类别。据我所研究,这可能是一个主题建模或聚类问题。虽然通过主题建模,我看到
的
大多数示例都是
基于
长文本,而不是几个关键字。处理这件事
的
好方法是什么? 我首先想到了一些简单
的
模糊
浏览 0
提问于2019-06-14
得票数 1
2
回答
两个特征向量间
的
相似性
度量
、
、
、
我有一个面部识别系统,包括以下细节:512维特征向量(归一化)成对
余弦
,欧氏距离当我想从一组feature vector中找到最接近
的
通过
对
difference(距离)
度量
进行
排序
。但该
浏览 0
提问于2020-07-24
得票数 4
回答已采纳
5
回答
用户之间
的
距离
、
、
我希望计算用户之间
的
“距离”,以便返回任意给定用户
的
前n个相似用户。对于每个用户,都有一系列
的
特性。这是接近一个推荐系统,但我没有评级,我不能分配每个用户
对
不同
的
产品,因此我需要比较“有多相似”
的
用户。 你
对
这类问题
的
算法/方法有什么建议吗?我发现了很多
基于
推荐系统
的
资源(有等级
和
项目),但这与我想要实现
的
不同。
浏览 0
提问于2019-06-17
得票数 4
回答已采纳
1
回答
将用户兴趣与内容相匹配(
基于
标签)
、
、
、
、
我有很多内容项目存储在数据库中,我知道用户感兴趣
的
标签。
例如
,Alice
对
诸如“保健”、“体育”
和
“社交”这样
的
标签感兴趣。每个内容项包含一个或多个标记。为了向Alice推荐新
的
内容,我将如何匹配这些内容?`id` INT(11) NOT NULL AUTO_INCREMENT, PRIMARY KEY (`id`)我把爱丽丝
的
兴趣
和
是否有一种方法可以使用像
余弦</e
浏览 3
提问于2016-06-24
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度学习第45讲:GloVe词向量与相关应用
RUBER:一种无监督对话系统回复质量的评价方法
AI研究新利器Etymo,妈妈再也不用担心我找不到论文!
论文| A Survey on Deep Visual Place Recognition
辅助决策系统中的态相似、势相似、感相似、知相似
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券