腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
找到
两个
数据
集
之间
的
相似性
,
并
生成
由
这些
重合
的
行
组成
的
新
数据
帧
?
r
、
bigdata
我在一个文件中有超过1000个站
的
无线电探空仪观测结果,以及我真正感兴趣
的
站(81个)
的
列表。我需要创建一个
新
的
数据
框,其中将包括第一个文件
的
行
。 因此,我有
两个
从.txt文件导入到R
的
数据
集
。第一个是
数据
框6694668x6,第二个是81x1,其中第二个
数据
集
的
行
与第一个
数据</em
浏览 9
提问于2019-10-17
得票数 0
回答已采纳
4
回答
优化星火作业,必须计算每个条目的相似度,
并
输出每个条目的顶N个相似项
scala
、
apache-spark
、
cross-join
例如,对于演员和类型,向量显示给定
的
演员在电影中是存在(1)还是缺席(0)。我
的
计算方法是在电影
数据
集
上使用交叉连接。然后,通过只使用movie1_id < movie2_id
的
行
来减少问题。不过,此
浏览 0
提问于2018-04-29
得票数 9
回答已采纳
1
回答
在R中查找
数据
框中列
的
平均值
r
、
dataframe
、
mean
我有一个矢量,它包含50个重新采样
数据
的
数据
帧
。因此,每个
数据
框中
的
所有列名都是一致
的
,但数值不同。每个
数据
帧
由
12
行
组成
。
如何
找到
50个
数据
帧
之间
特定列中每行
的
平均值,并将12个平均值放入一个
新
的
单列
数据
帧</e
浏览 2
提问于2017-10-25
得票数 0
2
回答
匹配KMeans指定
的
不同标签
python
、
labeling
我有以下问题:在dataset A中,我发现了一个集群,它
浏览 3
提问于2021-11-26
得票数 0
1
回答
计算两只熊猫DataFrames字符串
之间
的
距离
python
、
pandas
、
fuzzywuzzy
我有
两个
数据
帧
:Date Name Num 2013-11-24 Orange 8.6 2013-11-24 Apple,为此,我需要在
两个
数据
帧
之间
找到
Name
的
相似性
,现在我正在迭代每个
数据
帧
,
并
计算与其他
数据
帧
的
所有其他<
浏览 4
提问于2017-09-25
得票数 1
回答已采纳
1
回答
在R中,我
如何
加入和子集SpatialPolygonsDataFrame?
r
、
spatial
我试图找出在R中
如何
执行(在地理信息系统中很容易)操作
的
方法。让我们以spdep包中
的
多边形
数据
集
为例c <- readShapePoly(system.file("etc/shapes/columbus.shp", package="spdep")[1])我已经
找到
了可以使用subset选择逻辑语句
的
多边形。<- data.
浏览 2
提问于2013-04-15
得票数 4
回答已采纳
1
回答
在生产中使用R-
的
KNN
r
、
knn
我有一些
由
99
行
数据
组成
的
虚拟
数据
,一列是自由文本
数据
,另一列是目录。它分为与客户服务或与客户服务无关
的
两类。我将这99
行
数据
传递到我
的
R脚本中,创建了一个语料库,清理
并
解析了我
的
数据
,并将其转换为DocumentTermMatrix。然后,我将我
的
DTM转换为
数据
帧
,以使其更易于查看。我将类
浏览 6
提问于2017-03-07
得票数 0
回答已采纳
4
回答
测试非线性支持向量机
的
数据
集
dataset
、
artificial-intelligence
、
machine-learning
、
svm
我正在实现一个非线性支持向量机,我想在一个简单
的
不可线性分离
的
数据
上测试我
的
实现。谷歌并没有帮我
找到
我想要
的
东西。你能告诉我在哪里可以
找到
这样
的
数据
吗?或者至少,我
如何
手动
生成
这样
的
数据
? 谢谢,
浏览 1
提问于2011-05-07
得票数 8
回答已采纳
2
回答
两个
数据
集
之间
的
相似性
百分比
r
如何
找到
两个
数据
集
之间
的
相似性
(而不是相关性)? 我很难
找到
匹配
数据
集
之间
的
相似性
。我有一个主要
的
数据
集
,我想测试相同长度和相对时间序列
的
多个
数据
集
,以找出在序列、日复一日
的
相似和差异、最接近
的
水平值等方
浏览 7
提问于2017-06-09
得票数 0
1
回答
布尔
数据
的
相似度计算
recommender-system
、
similarity
我试图实现简单
的
推荐系统,
并
试图理解不同
的
方法来实现我
的
目标。 我
的
数据
集
由
用户和他们购买
的
物品
组成
。我有关于什么项目的用户购买
的
信息和
这些
项目的描述形式
的
标题。起初,我想我可以使用基于用户
的
协作过滤方法,但我仍然坚持这样做。我不太清楚
如何
计算布尔
数据
的
相似性
。E推荐项目,那
浏览 0
提问于2017-12-04
得票数 2
2
回答
For循环不打印
两个
数据
帧
之间
的
现有公共值
python
、
pandas
、
loops
、
for-loop
所以我有
两个
数据
集
,drinks和drinks2,关于星巴克饮料
的
营养信息,每个
数据
集
都有一组不同
的
饮料作为观察对象。Protein (g)','Vitamin A (% DV)', 'Vitamin C (% DV)', 'Calcium (% DV)', 'Iron (% DV)', 'Caffeine (mg)'] 在将
两个
数据<
浏览 34
提问于2019-09-20
得票数 0
1
回答
如何
计算DIR@FAR1 1%用于人脸识别?
image-processing
、
machine-learning
、
computer-vision
最近,在一些论文中,人们正在通过一种
新
的
协议来评估人脸识别方法,即基于LFW
数据
集
的
封闭
集
和开放
集
人脸识别。对于开放
集
,等级-1
的
准确性报告为检测和识别率(DIR),在固定
的
虚警/接受率(FAR)。我有一个图库和一个探测
集
,并且使用KNN进行分类,但是我不知道
如何
计算DIR@FAR1 1%。更新: 具体来说,对我来说模棱两可
的
是把远处固定在一个固定<em
浏览 4
提问于2016-05-14
得票数 0
回答已采纳
1
回答
columnSimilarities()用于计算产品间
的
余弦
相似性
pyspark
、
cosine-similarity
我有一个大
的
数据
集
,需要计算产品
之间
的
余弦
相似性
在项目-项目协作过滤
的
产品推荐。由于
数据
包含超过50000项和25000
行
,我选择使用Spark,
并
找到
了columnSimilarities()函数,它可以在DistributedMatrix上使用,特别是在RowMatrix或IndexedRowMatrix但是,有
两个
问题我很想知道。 RowMatrix<em
浏览 0
提问于2018-10-29
得票数 0
1
回答
如何
比较使用
两个
不同
的
数据
集
获得
的
两个
相似性
?
algorithm
、
similarity
我试图通过使用
两个
不同
的
数据
集
通过余弦相似度来计算用户与用户
的
相似度(用户是相同
的
,只是为了获得相似度而考虑
的
特征在
数据
集
之间
是不同
的
)。现在,有没有一种方法可以根据相似度值来判断这
两个
数据
集
有多相似?
浏览 0
提问于2017-05-22
得票数 0
2
回答
Lsh算法和频带
algorithm
、
nearest-neighbor
我读了很多关于lsh算法
的
资料,但我有一个关于它
的
问题,完全是在频带上。S2 = {5, 4, 4, 8} //band signatures for set S2当我在一个确定
的
波段b中得到一个集合(例如S1)
的
所有minwise签名时,我必须做什么?我必须对
这些
签名求和(例如1+2+4+5)或一个或运算符(例如1或2或4或5)或其他什么?
浏览 1
提问于2015-04-02
得票数 0
3
回答
字嵌入模型
machine-learning
、
deep-learning
、
word2vec
、
word-embedding
、
fasttext
我一直在搜索
并
尝试实现一个词嵌入模型来预测单词
之间
的
相似性
。我有一个
由
3550个公司名称
组成
的
数据
集
,其想法是用户可以提供一个
新
单词(这个词不在词汇表中),
并
计算新名称与现有名称
之间
的
相似性
。公司名称
的
平均长度
由
三个字
组成
,频率如下:预处理
的
结果是将标记发送到wo
浏览 5
提问于2019-10-04
得票数 1
回答已采纳
1
回答
R data -基于
数据
集中
的
单个相似列合并两
行
r
、
plyr
我认为这将是相对初级
的
,但我无论
如何
也想不出来。 假设有一个
数据
集
,其中有108
行
,
由
54个克隆
的
两个
读数
组成
。很大程度上,我需要根据克隆(第2列)压缩
数据
集
,从6:653取平均值,同时保留第1、2、3、654列
的
信息(这在两次读数
之间
对于
这些
列是相同
的
)。我有一个非常小
的
数据
集</e
浏览 1
提问于2013-09-23
得票数 0
1
回答
如何
使用二元盒图从
数据
集中删除异常值
r
、
dataset
、
boxplot
、
outliers
我有一个
数据
集
(见下文),它
由
多个变量
组成
,其中
两个
是'manu‘和'popul’,它们都包含数值。 然后从这幅图中我可以看到有一些异常值,我能够使用下面的代码识别出哪些值是异常值,我还将显示哪些值是异常值:
浏览 4
提问于2021-03-16
得票数 0
回答已采纳
1
回答
在Python中合并
两个
dataframe后,
如何
查找未成功合并
的
dataframe
行
?
python
、
python-3.x
、
pandas
、
dataframe
、
merge
在使用Pandas对
两个
数据
帧
进行左合并后,我希望
生成
一个
数据
帧
,其中包含未成功合并
的
第二个/右
数据
帧
的
行
。
数据
帧
df1和df2将根据两列合并,标题分别为城市和州。我这样做是为了
生成
合并后
的
数据
帧
df3: merged_df = pd.merge(df1, df2, how=&qu
浏览 15
提问于2020-11-03
得票数 0
2
回答
如何
为每一
行
添加来自泊松分布
的
模拟值,并将其添加到
数据
帧
中
r
、
dataframe
、
poisson
我试图通过为每一
行
包含500个来自泊松分布
的
模拟值来扩展
数据
帧
,该分布
的
参数Theta (count_mean)已经存储在
数据
帧
中。在下面的示例中,我只提供了一个
数据
帧
示例,因为我
的
实际
数据
由
超过50,000
行
(即In )
组成
。", "4118", "5330"),
浏览 29
提问于2020-06-22
得票数 0
回答已采纳
点击加载更多
相关
资讯
伦敦大学交互表演设计专业研究生的 AI 库布里克项目
Python 谱聚类算法从零开始
pandas系列学习(五):数据连接
无监督视频物体分割新思路:实例嵌入迁移
手把手教你从零起步构建自己的图像搜索模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券