腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
SVD在火花放电中的应用
、
、
、
、
现在,我想从这个dataframe构建IndexRowMatrix,这样我就可以运行svd函数了,这里描述了mat =
RowMatrix
(tfidfData.
rdd
.map(lambda x: x.features)) 我使用
RowMatrix
,因为要构建它,我不需要提供元组,但我甚至不能
浏览 8
提问于2017-09-20
得票数 2
回答已采纳
1
回答
将
Spark数据帧转
换为
Spark DenseMatrix进行操作
、
、
、
我在互联网上找遍了,却找不到如何简单地
将
spark中的数据帧转换成矩阵,这样我就可以对其进行矩阵运算。 我如何在Spark 2中简单地实现这一点?
浏览 0
提问于2017-02-18
得票数 2
2
回答
火花矩阵上的基本线性代数
、
、
我试图在存储为火花
RowMatrix
(使用Python )的矩阵上运行一些基本的线性代数操作(特别是
转
置、点积和逆)。按照docs中的示例(就我的情况而言,我将在矩阵中有更多的行,因此需要火花),假设我有如下所示:rows = sc.parallelize([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11,
浏览 0
提问于2015-09-21
得票数 7
回答已采纳
1
回答
在
pyspark
中读取CSV并转
换为
float
、
我正在尝试读取CSV文件,并使用
PySpark
将其转
换为
RowMatrix
。我将此文件作为
RDD
读取的代码如下:我从Spark示例中了解到,在创建
RowMatrix
之前,我需要创建密集向量。我的问题是:如何从上面的代码开始
将
数据转
换
浏览 0
提问于2017-09-15
得票数 0
1
回答
Pyspark
:
将
RDD
转
换为
RowMatrix
、
、
、
我有一个形式的
RDD
(id1,id2,score)。我想使用
RowMatrix
.columnSimilarity,但我需要先将它转
换为
RowMatrix
。如果我的数据较小,我可以将其转
换为
Pyspark
dataframe,然后使用pivot,如但这与10,000简单的
rdd
_Mat =la.<
浏览 14
提问于2017-08-11
得票数 1
回答已采纳
1
回答
将
本地向量转
换为
RDD
[Vector]
、
关于的教程,import org.apache.spark.mllib.linalg.distributed.
RowMatrix
val rows:
RDD
[Vector] = ... // an
RDD
of local vectorsvalmat:
RowMatrix
=
浏览 3
提问于2015-10-05
得票数 5
回答已采纳
1
回答
Pyspark
实现
、
、
我被困在一个问题中,我想要做一个PCA在一个
Pyspark
列。列的名称是“特性”,其中每一行都是一个SparseVector。这就是流程:特征-列的名称 行(features=SparseVector(2,{0:654.0,1:20.0}))i = <em
浏览 4
提问于2019-11-19
得票数 2
2
回答
将
包含数组的数据帧重新格式化为
RowMatrix
我希望将此数据转
换为
行矩阵,其中的列和行将采用以下mat格式: from
pyspark
.mllib.linalg.distributed import
RowMatrix
mat =
RowMatrix
(rows) exact = mat.co
浏览 8
提问于2019-05-10
得票数 0
回答已采纳
1
回答
如何计算
pyspark
数据帧的协方差矩阵?
、
、
、
我有一个很大的
pyspark
数据框架,其中列是一些产品,行是其随时间变化的价格。我需要计算所有产品的协方差矩阵,但数据太大,无法转
换为
pandas数据帧,因此我需要使用
pyspark
进行计算。
浏览 68
提问于2021-06-15
得票数 0
2
回答
火花转换DataFrame到
RowMatrix
以有效计算所有对相似度
、
、
、
、
我看到,如果我使用一个columnSimilarities对象,我可以使用
pyspark
.mllib模块的
RowMatrix
方法。由于我想出的用DataFrame解决这个问题的每一种方法都很低效,所以我想知道从我的DataFrame中获得
RowMatrix
的最佳方法。
浏览 0
提问于2018-10-25
得票数 1
回答已采纳
2
回答
如何计算Apache中两个分布式
RowMatrix
的点积?
、
、
、
、
设Q是星火中的分布式行矩阵,我要计算Q与其
转
置Q'.的交叉积val phi = new
RowMatrix
(phiRDD) // phiRDD is an instance of
RDD
[Vector]val phi = new IndexedRowMatrix(phiRDD) // ph
浏览 2
提问于2017-09-04
得票数 1
回答已采纳
1
回答
需要通过类似于scipy.linalg.eig的特征值分解在非对称方阵的
pyspark
中找到特征向量
、
、
、
、
我想在
pyspark
中找到它的特征向量。我知道computeSVD给了我特征向量,但这些是通过奇异值分解得到的,结果是一个密集的矩阵,这是一个本地数据结构。如果是,有什么方法可以在
pyspark
中使用它吗?或者,对于同样的问题,是否有其他解决方案。我可以以某种方式直接在我的代码中使用ARPACK吗?或者我必须自己编写Arnoldi迭代(例如)?
浏览 0
提问于2017-09-21
得票数 2
1
回答
文档(行)之间的余弦相似度- spark
、
、
、
我使用spark任务来计算文本文档之间的相似度:CoordinateMatrixrowsimilarity=
rowMatrix
.columnSimilarities(0.5); JavaRDD<MatrixEntry> entries = rowsimilarity.entries
浏览 6
提问于2017-07-27
得票数 4
1
回答
如何
将
向量的列或序列转
换为
SparseMatrix?
、
、
、
正如标题所述,我有一个向量序列(在DataFrame列中,但可以使用.collect()将其转
换为
RDD
或序列)。我想把这些矢量收集到一个本地SparseMatrix中。我可以轻松地制作一个
RowMatrix
,但我也看不到
将
RowMatrix
转
换为
本地矩阵的任何方法。val exampleMatrix = new
RowMatrix
(df_with_vectors.select("sparse").
rdd
.map(_.getAs[S
浏览 0
提问于2018-09-10
得票数 0
回答已采纳
1
回答
转
置
RowMatrix
在
PySpark
中
、
、
你好,我想知道如何在
RowMatrix
中转接
PySpark
。MLLibVectors.dense([3.0, 4.0]), )] features=df.select("features").
rdd
.map(lambda row: row[0]) print mat.rows.first() mat=mat.T
浏览 6
提问于2017-11-03
得票数 4
回答已采纳
1
回答
Spark Scala余弦相似度矩阵
、
scala新手(
pyspark
guy),尝试计算行(项)之间的余弦相似度| 2|(7,[1,3,6],[1.0,6...|我试图按照这篇文章
将
df转
换为
IndexedRowMatrix,但在如何正确映射
rdd
的scala语法方面遇到了问题。import
浏览 1
提问于2019-08-17
得票数 0
1
回答
火星雨流中的to.JSON()
、
、
、
、
采用toJSON()方法
将
DataFrame转
换为
文档的
RDD
,并在火花流的transform()函数中实现了这一
转
换。我使用
pyspark
进行编码,如下所示: rddDataframe = sqlContext.createDataFrame(
rdd
)return
rdd
dstream_test = dstream_in.transfor
浏览 2
提问于2016-06-30
得票数 0
1
回答
使用python实现Spark Matrix乘法
、
、
这是我的数据我的向量
RDD
rows_2 = sc.parallelize([[1, 2], [4, 5]])mat1 =
RowMatrix
(rows_1)我想做这样的事情:我写了一个函
浏览 0
提问于2016-06-12
得票数 6
2
回答
使用Scala
将
Apache中的矩阵转
换为
RowMatrix
、
、
、
= sc.parallelize(xxr)val xxrm:
RowMatrix
= new
RowMatrix
(xxd) 然而,这确实是一种粗野和彻底的黑客行为。
浏览 8
提问于2015-05-11
得票数 5
回答已采纳
1
回答
在Apache中使用CoordinateMatrix后打印
RowMatrix
.columnSimilarities
、
、
我首先使用mllib的transform
将
文档转
换为
向量,然后将其转
换为
RowMatrix
并使用columnSimilarities()方法。import org.apache.spark.
rdd
.
RDD
import org.apache.spark.mllib.feature.HashingTFto compute cosin
浏览 3
提问于2016-03-28
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PySpark,大数据处理的Python加速器!
怎样将mp4转换为flv?mp4转flv用它很方便!
将视频转换为gif用什么软件 视频转gif软件介绍
PySpark,一个大数据处理利器的Python库!
如何将图片文件转换为PDF文档-图片转PDF的方法分享
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券