腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
MKL是否为主要订单优化cblas?
、
、
、
、
我正在使用mkl cblas_dgemm,目前它与CblasRowMajor、CblasNoTrans、CblasNotrans一起用于我的
矩阵
。我知道
c
是一种主要的行
语言
,而dgemm是一种主要的列
算法
。我很想知道,如果我链接到cblas_dgemm,那么切换
矩阵
的顺序是否会对mkl
算法
产生任何影响。mkl是否足够聪明,能够在幕后做一些我想做的事情来优化
矩阵
乘法
?如果没有,用mkl执行
矩阵
乘法
的最佳方法是什么?
浏览 5
提问于2015-09-07
得票数 7
回答已采纳
1
回答
Strassen
算法
的就地实现?
、
、
、
我设法实现了一个就地解决方案,通过对
矩阵
乘法
的朴素的Divide & Conquer
算法
进行索引操作,该
算法
在每次递归中需要8次递归调用。然而,当我尝试实现Strassen
算法
时,我找不到一种就地实现它的方法。相反,在使用
C
语言
编程时,我必须为7个递归调用分配19个子
矩阵
。 如何就地实现Strassen
算法
?或者这是可能的?
浏览 5
提问于2013-11-13
得票数 3
1
回答
矩阵
-
矩阵
乘法
/
矩阵
-向量
乘法
有哪些不同类型的
算法
、
、
矩阵
-
矩阵
乘法
和
矩阵
-向量
乘法
有哪些不同类型的
算法
?你认为哪种
算法
更好?
浏览 0
提问于2011-01-11
得票数 1
回答已采纳
3
回答
Strassen计算
矩阵
平方的方法有什么问题?
、
、
使用与相同的方法,只需5次
乘法
就足以计算
矩阵
的平方。如果A2 = a,b,
c
,d,则
乘法
为a* a,d* d,b* (a + d),
c
* (a + d),b*
c
。如果我们将这个
算法
推广到求
矩阵
的平方,复杂度就会降低到n^log5,基数为2。 我被问到一个问题,要找出这个
算法
的错误之处,以及当它失败时,如果我们推广这个
算法
来求
矩阵
的平方?
浏览 26
提问于2014-12-18
得票数 2
1
回答
最快的“转置-共轭”方法
、
、
、
给定
矩阵
A和P,我需要计算“转置-共轭”(不确定这个术语是什么)。for(int l=0;l<n;l++) X[i][j]+=P[i][l]*A[l][k]*P[j][k]; }然而,这是O(n^4),我也可以做两个正则
矩阵
乘法
我是在这里遗漏了什么,还是应该坚持两个
乘法
?X = P X
浏览 3
提问于2015-12-17
得票数 4
回答已采纳
5
回答
矩阵
乘法
算法
时间复杂度
、
、
我想出了这个
矩阵
乘法
的
算法
。我在某处读到
矩阵
乘法
的时间复杂度为o(n^2)。但是我想我的这个
算法
会得到o(n^3)。我不知道如何计算嵌套循环的时间复杂度。所以请纠正我。for i=1 to n
c
[i][j]=0
c
[i][j] =
c
[i][j]+a[i][k]*
浏览 2
提问于2011-12-18
得票数 31
回答已采纳
1
回答
两个巨大的稠密
矩阵
的
乘法
Hadamard--乘以一个稀疏
矩阵
、
、
、
、
我有两个密集
矩阵
A和B,每个
矩阵
的大小都是3e5x100。另一个大小为3e5x3e5的稀疏二进制
矩阵
C
。由于最终结果不需要整个AB',因此只计算
乘法
A_iB_j'就足够了,其中
C
_ij != 0,其中A_i是
矩阵
A的列i,
C
_ij是
矩阵
C
的位置(i,j)处的元素。建议的方法类似于下面的
算法
: result = numpy.initalize_sparse_matrix(shape
浏览 35
提问于2021-01-20
得票数 4
回答已采纳
1
回答
内存受限情况下GEMM的有效
算法
、
、
、
、
我正在寻找一个高效的
算法
来执行(密集的)大型
矩阵
乘法
在GPU上。更具体地说,对于GPU没有足够内存容纳所有
矩阵
的情况(例如,m=n=k=100,000)。我使用cuBLAS在块中执行
矩阵
乘法
,我可以想到许多基于块的方法,但是它们效率很低,因为A、B或
C
矩阵
必须多次复制到或从GPU复制。我知道已经提出了许多有效的
算法
(例如,),但我无法找到所使用的
算法
的具体定义。是否有
算法
可以在没有冗余副本的情况下执
浏览 7
提问于2022-03-01
得票数 0
2
回答
奇异值分解的时间复杂度
、
、
、
在过去的几周里,我一直在尝试用
C
语言
实现奇异值分解,目前我一直在使用
算法
6 found ,据我所知,这个
算法
将在O( n^5 )时间内运行,因为有两个循环(其中一个循环不会从0到n,我知道但n^5是一个粗略的界限),在内部循环中必须完成
矩阵
乘法
,这是一个n^3的过程。然而,根据,对于n乘n
矩阵
,奇异值分解可以在O(2n^3)中计算。有谁知道我在哪里可以找到解决这种时间复杂性的
算法
?
浏览 1
提问于2015-03-24
得票数 7
2
回答
MATLAB中的并行
矩阵
乘法
、
、
在Matlab中是否有一种相对容易实现或透明的方法来并行相乘两个大型
矩阵
?理想情况下,我想用最多几行代码来执行这个并行
乘法
,比如:
C
_2 = pmult(A,B) % parallel如果有一种方法可以很容易地完成这个并行
乘法
,谁能指点我的代码吗?如果没有,是否有人对在Matlab中实现并行
矩阵
乘
浏览 5
提问于2011-11-30
得票数 3
回答已采纳
1
回答
MATLAB中
矩阵
乘法
的时间复杂度
、
、
有人知道MATLAB使用哪种
算法
进行
矩阵
乘法
吗?它的时间复杂度是多少?
浏览 0
提问于2013-07-18
得票数 8
回答已采纳
1
回答
用Python和R
语言
实现
矩阵
乘法
的不同结果
、
、
、
我正在转录一个从R程序到python的多层感知器
算法
,但是我面临一个问题,
矩阵
乘法
给了我一个不同的结果:> hidden <- matrix(
c
(-0.4442772, -0.1844143, 0.2783537, 0.2599441, -0.3190043, 0.2062185), nrow=2, ncol=3) > hidden %*% Xp0.3190043, 0.2062185]]) >>
浏览 4
提问于2018-06-01
得票数 0
回答已采纳
3
回答
Laderman的3x3
矩阵
乘法
只有23次
乘法
,值得吗?
、
、
、
取两个3x3
矩阵
A*B=
C
的乘积。天真地,这需要使用进行27次
乘法
。如果一个人很聪明,你只需要使用23个
乘法
,就可以做到这一点。这项技术包括保存中间步骤并以正确的方式组合它们。现在让我们修复一种
语言
和一种类型,比如使用
C
++元素的double。如果Laderman
算法
是硬编码的,而不是简单的双循环,那么我们可以期望现代编译器的性能能够消除
算法
的差异吗?
浏览 3
提问于2012-05-31
得票数 22
回答已采纳
1
回答
稀疏
矩阵
乘法
的最佳包
、
、
、
、
我正在寻找最好的包稀疏
矩阵
乘法
上的单核解。我不寻找CUDA,MPI或OpenMP解决方案。我必须乘两个大
矩阵
,它们是稀疏格式的。一个
矩阵
是677000乘48000,另一个
矩阵
是48000乘8192.这里,n-by-d表示行的n:
浏览 0
提问于2013-08-23
得票数 2
回答已采纳
1
回答
内存高效中心稀疏SVD/PCA (以Julia为单位)
、
、
、
我有一个300万×900万稀疏
矩阵
和几十亿个非零项。R和Python不允许大于MAXINT非零项的稀疏
矩阵
,因此我发现自己使用Julia。虽然用标准偏差来缩放这些数据是微不足道的,但是贬低当然是一种天真的方式,因为这会创建一个密集的、200+ is的
矩阵
。 执行svd的相关代码是julia,可以在上找到。在我再次尝试讨论这个问题之前,我想知道我是否能得到反馈,如果这被认为是一个合适的攻击计划,或者是否有一种简单得多的在这么大的
矩阵
上进行SVD的方法(我还没有看到它,但我可能遗漏了一些东西)。编辑:我没有修改base,而是尝
浏览 9
提问于2017-09-25
得票数 7
回答已采纳
1
回答
弗洛伊德-沃尔和
矩阵
相乘图
算法
有什么区别?
、
、
、
、
程序采用
矩阵
乘法
算法
。 我实现了
矩阵
乘法
算法
的定义:一个伪
矩阵
乘法
,其中加法被最小化和加法代替。但是通过这样做,我最终得到了弗洛伊德-沃尔
算法
,我也很难用这种方式来确定负成本周期的存在。我假设我的
算法
和实际的
矩阵
相乘图
算法
有很大的区别,但这到底是什么呢?
浏览 4
提问于2017-05-01
得票数 2
回答已采纳
1
回答
Mpi函数定义
、
我用
c
语言
编写了一个程序,使用MPI (消息传递接口)递归地计算下三角
矩阵
的逆
矩阵
。每个cpu向另外两个cpu发送2个子
矩阵
,它们计算它们,然后将它们返回给cpu调用者。当cpu调用者有了它的子
矩阵
时,它必须执行
矩阵
乘法
。在递归方程中,瓶颈是
矩阵
乘法
。我用
c
实现了mpi的并行
乘法
,但是我不能把它嵌入到一个函数中。有可能吗? 谢谢,西蒙妮
浏览 8
提问于2009-08-03
得票数 0
1
回答
哦,渐近符号{O(f(N)})是不是
算法
可以拥有的最慢的运行时间?(它给出了渐近的上限,这意味着最慢的运行时间)
、
我正在读一本叫“
算法
导论”的书,他们正在分析一种叫做斯特拉森
矩阵
乘法
算法
的
算法
,上面写道:“”人们可能首先认为任何
矩阵
乘法
算法
都必须花费ω(N3)时间,因为
矩阵
乘法
的自然定义需要很多
乘法
运算。然而,你可能错了:我们有一种方法可以在O(n3)时间内将
矩阵
相乘。“” O(n3)时间不比omega(n3)时间慢吗?因为omega给出了渐近的下界意味着最快的运行时间。
浏览 1
提问于2019-08-12
得票数 0
1
回答
实现Strassen
算法
、
斯特拉森
算法
是第一种以子立方时间复杂度进行
矩阵
乘法
的方法,即对一对n*n
矩阵
的O(n**log2(7)) (假设其中的数字足够大,它们的O(n*log2(n))精确
乘法
已成为对性能的限制,任何嵌套结构和函数调用相比都是可以忽略不计的对于2*2
矩阵
,它被定义为 lambda a,b: (lambda a,b,
c
,d,e,f,g: (a+d-e+g,
c
+e,b+d,a-b+
c
+f))((a[0]+a[3])*(b[0]+b[3]),([0
浏览 0
提问于2022-12-21
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
什么是矩阵乘法?详述矩阵乘法的原理?用C语言实现矩阵乘法的算法。内附代码。
C语言编程入门:用C语言输出九九乘法表
数学的力量——稀疏矩阵,所有科学都是矩阵乘法
矩阵乘法无需相乘,速度提升100倍,MIT开源最新近似算法
C语言编程练习之——打印九九乘法表
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券