有两种常见的矩阵类型,密集和稀疏。主要区别在于稀疏指标有很多零值。密集的指标没有。这是一个具有 4 列和 4 行的稀疏矩阵的示例。
在上面的矩阵中,16 个中有 12 个是零。...在这里使用的是 scipy包的sparsemodule。...import numpy as np
from scipy import sparse#create the metrix with numpy
m = np.array([[1,0,0,0],...[0,1,2,0],
[0,0,0,0],
[2,1,1,1]])
#convert numpy array into scipy csr_matrix...所以可以理解为将这些数据转换为稀疏矩阵是值得得,因为能够节省很多得存储。
那么如何判断数据的稀疏程度呢?使用NumPy可以计算稀疏度。