腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4128)
视频
沙龙
1
回答
当
存在
重复
时
,
稀疏
到
密集
的
矩阵
降
低了
维
数
、
、
为此,请执行以下操作:s = sparse(i, 1:lenght(i), 1)这和预期
的
一样工作良好,但是
当
数组为i = [2, 1,3, 3]
时
。full函数给出了一个3 x 4
的
矩阵
,而不是4 x 4
的
矩阵
。Julia认为最后一行是不必要
的
,并删除了它,对我来说,情况并非如此。
当
索引array i中有
重复
时
,是否可以使用spars
浏览 2
提问于2018-01-25
得票数 0
回答已采纳
1
回答
在python中将数字存储在多维数组(
稀疏
)中
的
最佳方法
、
、
当
问题是对称
的
,只需要计算一些数字
时
,N
维
计算
的
最佳容器对象是什么?(kk, M): results[ii,jj,kk,ll] = res 这个数组中
的
许多元素是完全冗余
的
对于更高
的
N更是如此(我希望使用N=10或理想情况下
的
N=15)。 对于这样
的
问题,在每一步中使用列表和追加更好,还是字典或<em
浏览 15
提问于2020-08-18
得票数 0
回答已采纳
1
回答
是否有可能在大型
稀疏
矩阵
上使用scikit TSNE?
、
、
、
解释说,fit_transform只能用于
密集
矩阵
,但我有一个csr格式
的
稀疏
矩阵
,我想对它执行tsne。文档说要对
稀疏
矩阵
使用fit方法,但这并不返回低
维
嵌入。我很感谢我可以像在.todense()中一样使用方法,但是我
的
数据集非常大(0.4*10^6行和0.5*10^4列),所以内存中不适合使用。真的,用
稀疏
矩阵
来做这件事是很好
的
。是否有一种方法可以使用scikit TSNE
浏览 6
提问于2017-09-26
得票数 4
回答已采纳
1
回答
关于向图中输入
稀疏
矩阵
由于数据维度太大,我不得不将数据转换为
稀疏
矩阵
,而不是
密集
数组。 然而,由于该图包含cnn,当我直接给
稀疏
矩阵
喂入时,我被告知cnn不能接收
稀疏
张量。所以我得先做“
稀疏
到
稠密”
的
操作。但问题是,我
的
数据(多
稀疏
矩阵
)应该转换成二
维
稀疏
矩阵
。(例如,我有
稀疏
matrix1,dim为14,25500,
稀疏<
浏览 0
提问于2017-10-13
得票数 0
回答已采纳
1
回答
如何使用嵌入减少回归问题
的
特征
、
、
、
我已经使用假日作为我
的
模型中
的
一个功能,以热编码格式,即我有11个二进制特性,每个代表一个假期。我刚开始嵌入。我
的
问题是,它是否有意义,以及它是否对如何做它有任何暗示?
浏览 0
提问于2021-01-14
得票数 2
1
回答
sparsity中高
稀疏
矩阵
的
意义
、
、
我使用sk-learn.CountVectorizer n.CountVectorizer()创建向量
矩阵
,发现其中57%填充了0。在一些在线情况下,他们
的
稀疏
矩阵
只有30%填充了零。我想知道
稀疏
程度
的
影响。在
稀疏
矩阵
中有较少
的
零是好
的
还是坏
的
,还是没有区别?我们对这一意见有何评论?
浏览 3
提问于2020-05-18
得票数 0
回答已采纳
5
回答
稀疏
图和
密集
图
的
区别是什么?
、
、
我读到用邻接表表示
稀疏
图,用邻接
矩阵
表示稠密图是很理想
的
。但我想要了解
稀疏
和
密集
图之间
的
主要区别。
浏览 1
提问于2012-09-26
得票数 49
回答已采纳
2
回答
使用随机森林对文本文档进行分类
、
、
、
我有一套4k
的
文本文档。他们属于10个不同
的
班级。我正在尝试看看随机森林方法是如何执行分类
的
。问题是我
的
特征提取类提取了200k个特征(组合了单词、二元语法、搭配等)。这是高度
稀疏
的
数据,sklearn中
的
随机森林实现不能与
稀疏
数据输入一起工作。 问:我有哪些选择?减少功能
的
数量?怎么做到
的
?问:有没有使用
稀疏
数组
的
随机森林
的
实现?我
的
相关代码如
浏览 13
提问于2014-02-11
得票数 5
3
回答
在Python中动态构造磁盘上
的
稀疏
矩阵
、
、
、
、
我目前正在做一些内存
密集
型
的
文本处理,为此我必须构造一个维度为~ (2M, 5M)
的
float32s
的
sparse matrix。当我读取一个5M文档
的
语料库
时
,我是一列一列地构建这个
矩阵
。为此,我使用了SciPy中
的
稀疏
dok_matrix数据结构。然而,当到达第500,000个文档
时
,我
的
内存已满(约使用30 is ),程序就会崩溃。我最终想做
的
是,使用sklearn对
浏览 1
提问于2015-06-25
得票数 13
1
回答
我可以标准化我
的
PCA应用计数向量吗?
、
、
、
我在我
的
X_train上应用了CountVectorizer(),它返回了一个
稀疏
矩阵
。 通常,如果我们想标准化
稀疏
矩阵
,我们会传入with_mean=False参数。scaler = StandardScaler(with_mean=False) X_train = scaler.fit_transform() 但在我
的
例子中,在我
的
X_train上应用了CountVectorizer之后,我还执行了主成分分析(TruncatedSVD)来减少
维
<e
浏览 10
提问于2019-03-07
得票数 2
回答已采纳
1
回答
寻找两个多维数组(如JSON文档)之间
的
相似性
、
、
、
、
}我需要做
的
是计算: 前25名
的
文件最类似于这一份。像json字符串
的
Minhash那样
的
东西会起作用吗?我
的
第
浏览 1
提问于2013-12-03
得票数 3
回答已采纳
2
回答
特征数量多
的
T-SNE
、
、
如果我们有大量
的
功能(超过50个),我们应该使用than吗?根据https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html:强烈建议使用另一种
降
维
方法(例如,对于
密集
数据使用PCA或对于
稀疏
数据使用TruncatedSVD ),以便在特征数量非常多
的
情况下将
维
数
减少
到
合理
的<
浏览 0
提问于2021-06-22
得票数 1
回答已采纳
0
回答
为什么对
稀疏
矩阵
求和会留下一个空维度?
、
、
除非我们设置了keepdims=True,否则在对numpy.ndarray求和
时
,它会降低数组
的
维
数
。然而,这似乎不适用于Scipy
的
稀疏
矩阵
:print(matrix.shape此外,尝试将总和
的
结果转换为
密集
的
Numpy数组失败: matrix.toarray()
浏览 4
提问于2017-12-02
得票数 2
5
回答
将PCA应用于非常大
的
稀疏
矩阵
、
、
、
我正在用R做一个文本分类任务,我获得了一个大小为22490×12万
的
文档项
矩阵
(只有400万个非零条目,小于1%
的
条目)。现在,我想利用主成分分析( PCA )来降低
维
数
。不幸
的
是,R不能处理这个庞大
的
矩阵
,所以我将这个
稀疏
矩阵
存储在一个文件中,格式为“matrix”,希望使用其他一些技术来进行PCA。因此,有人能给我一些有用
的
库(不管编程语言是什么),它可以方便地用这个大规模
矩阵
浏览 16
提问于2012-05-23
得票数 18
1
回答
图表示:邻接表与
矩阵
、
、
我正在为一次编码面试做准备,并且在图表上刷新了我
的
头脑。我想知道:在我见过
的
所有地方,都假定邻接表比大型
稀疏
图
的
邻接
矩阵
更有效,因此在这种情况下应该更好。另外,
当
O(1)在列表中
时
,计算一个节点
的
输出边
数
需要
矩阵
中
的
O(N),以及该列表
的
O(num相邻节点)中
的
相邻节点,而不是该
矩阵
的
O(N)。这些地方包括Cormen等人<em
浏览 8
提问于2011-07-08
得票数 11
回答已采纳
3
回答
如何将scipy.sparse
矩阵
与广播
的
密集
一
维
数组元素相乘?
、
、
、
假设我有一个二
维
稀疏
数组。在我
的
实际用例中,行数和列
数
都要大得多(比如20000和50000),因此
当
使用
密集
表示
时
,它无法放入内存:>>> import scipy.sparse现在假设我有一个
密集
的
一
维
数组,其中所有非零组件
的
大小都是3(在我
的
现实生活中是50000 ): >>>
浏览 0
提问于2010-07-14
得票数 46
回答已采纳
1
回答
TensorFlow tf.sparse_tensor_dense_matmul
、
、
、
我运行了一个测试tf.sparse_tensor_dense_matmul操作
的
小实验。不幸
的
是,我对这个结果感到惊讶。 在增加每次运行
的
稀疏
性
的<
浏览 2
提问于2016-08-25
得票数 4
回答已采纳
1
回答
稀疏
矩阵
-行划分
的
向量乘法
、
、
我是MPI和并行计算环境中
的
newby。我和有不同
的
稀疏
矩阵
,我试图用行划分将
稀疏
矩阵
与
密集
向量相乘,其大小分别为N和Nx1。我将测试我
的
并行MPI程序
的
进程
数
为1,2,4,8,16。我已经对这个算法做了一些研究,并从中找到了一个更好
的
解决方案和路线图。算法是这样
的
; 首先,对每个进程进行整体
稀疏
矩阵
逐行划分,并对
密集
向量进
浏览 1
提问于2019-05-10
得票数 0
回答已采纳
2
回答
tf上截断
的
svd值错误数组太大
、
、
我试图将TruncatedSVD.fit_transform()应用于TfidfVectorizer在scikit-learn中给出
的
稀疏
矩阵
,它提供: text = tfv.transform(text)我可以使用
的
其他方法是什么或者
降
维
浏览 0
提问于2013-11-26
得票数 2
回答已采纳
1
回答
大型数据集
的
有效
降
维
方法
、
、
我有一个具有大约100万行和大约500 K
稀疏
特性
的
数据集。我想把
维
数
降到1K-5K稠密特征
的
某个地方。sklearn.decomposition.PCA不工作在
稀疏
数据上,我尝试过使用sklearn.decomposition.TruncatedSVD,但是很快就得到了一个内存错误。在这个尺度上,我
的
有效
降
维
选择是什么?
浏览 0
提问于2018-08-29
得票数 14
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习:维度打击
数学的力量——稀疏矩阵,所有科学都是矩阵乘法
每天一个ml模型——降维
OpenAI 发布稀疏计算内核,更宽更深的网络,一样的计算开销
机器学习降维之主成分分析
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券