在监督学习中使用的训练示例在MLlib中被称为“labeled point”
一 本地向量
本地向量存储于单台机器,其拥有整类型的行,从0开始的索引,和double类型的值。...Mllib支持密集矩阵,其输入值按照列column-major顺序存储在单个double数组中。稀疏矩阵是其非零值按照column-major顺序以压缩稀疏列(CSC)格式存储。...密集矩阵的存储方式下,表现为:[1.0, 3.0, 5.0, 2.0, 4.0, 6.0],矩阵大小为(3, 2)
本地矩阵的基类是Matrix,有两个实现:DenseMatrix和SparseMatrix...(row, column, value)
BlockMatrix是一个分布式矩阵,格式是(Int,Int,Matrix)。
注意
分布式矩阵的底层RDD必须是确定性的,因为我们缓存矩阵大小。...QR分解的形式为A = QR,其中Q是正交矩阵,R是上三角矩阵。对于奇异值分解(SVD)和主成分分析(PCA),后面会出文章介绍。