腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
影响动态并行
内核
启动
开销的因素是什么?
、
当您从GPU上的主
内核
中
启动
辅助
内核
时,会有一些开销。造成或影响此开销的因素是什么?例如,
内核
代码的大小,正在
启动
内核
的SM的占用率,
内核
参数的大小等。为了回答这个问题,让我们将“开销”定义为以下时间间隔的总和:End: SM开始执行子
内核
的一条指令Start: Last SM执行子
内核
的任何指令(或者子
内核
指令的最后一次写入被提交到相关的内存空
浏览 6
提问于2017-03-20
得票数 3
1
回答
OpenCL:设备端无序队列也是并行的吗?
、
按照规范:
内核
B
启动
,
内核
B完成,
内核
A
浏览 1
提问于2019-01-02
得票数 0
1
回答
无法在IBM笔记本中使用Spark2.0
启动
Scala2.11
、
、
当尝试使用Scala2.11/Spark2.0
内核
在IBM上
启动
任何笔记本时,我会得到以下错误: 我已经确保我的其他笔记本中的所有
内核
都停止了,并且我已经尝试更改了Spark版本。我能够创建并
启动
Python/Spark笔
浏览 0
提问于2017-10-06
得票数 1
回答已采纳
1
回答
内核
启动
和执行之间的平均时间?
、
、
、
如果我正确理解,当您异步
启动
CUDA
内核
时,它可能会立即开始执行,或者等待先前的异步调用(传输、
内核
等)首先完成。(我也知道
内核
在某些情况下可以并发运行,但我现在想忽略这一点)。我如何知道从
启动
内核
(“队列”)到真正开始执行
内核
之间的时间。实际上,我只是想知道在我的程序的一次运行中所有
启动
的平均“排队时间”(通常是数万次或数十万次
内核
启动
)。我试图模拟--每次
内核
启动
时,我都会删除
浏览 2
提问于2011-07-13
得票数 1
2
回答
用户级线程如何与
内核
级线程对话
、
、
、
比方说,现在我重新
启动
了我的计算机,并且已经运行了10
内核
级线程。 过了一会儿,我决定运行一个python程序,它将
启动
一个进程,其中包含四个线程。其中三个线程必须运行一个执行系统调用的函数。( a)当python程序
启动
时,
内核
将立即在
内核
空间中
启动
另外4个线程(因此现在
内核
空间中有14个线程)。当用户级的这3个线程
启动
系统调用时,
内核
将把这些用户级线程映射到在python程序
启动
时
内核<
浏览 12
提问于2022-09-10
得票数 2
回答已采纳
3
回答
Linux
内核
挂在“
启动
内核
.”
、
、
、
、
我已经成功地在嵌入式设备上启用了安全
启动
。问题是,当我在这种模式下
启动
时,进程似乎在行之后就被卡住了:一旦U复制了内存中的
内核
并发出了一个bootm命令。不过,我确实注意到,在不处于安全模式时,我能够成功地引导
内核
映像,因此对于供应商来说,这可能是一个更合适的问题。 1)一般来说,在哪里可以找到有关执行切换阶段的U-boot诊断信息?2)在什么时候执行完全给
内核
?也就是说,U引导何时失效?
浏览 0
提问于2016-06-22
得票数 8
1
回答
CUDA父
内核
可以
启动
比父
内核
更多线程的子
内核
吗?
、
我有一个简单的CUDA
内核
,它创建一些工作,然后
启动
新的
内核
来执行这些工作。假设我只用1个线程的一个块
启动
父
内核
,如下所示: int nItems = 100{ // invok
浏览 16
提问于2021-10-09
得票数 0
回答已采纳
1
回答
Angstrom
内核
-坚持“
启动
内核
.”
、
、
我一直在尝试使用BeagleBone构建系统来编译Black
内核
。我尝试过很多不同的事情,但我会描述其中一件我认为最有可能奏效的事情。我使用了准备好的Angstrom映像(Angstrom-Cloud9-IDE-GNOME-eglibc-ipk-v2012.12-beaglebone-2013.06.20.img),然后编译了
内核
(/oebb.sh bitbake virtual/kernel 我的想法是,我将使用uImage并复制它,而不是在/boot/中复制它,但是它会被困在“
启动
内核</
浏览 1
提问于2016-02-27
得票数 0
1
回答
我可以在子
内核
(CUDA动态并行)中使用cooperative_groups::sync(网格)吗?
、
、
我有一个精简
内核
,它使用协作组(包含cg::sync(grid)、cg::sync(cta)、grid.thread_rank()等)。当还原
内核
从主机
启动
时,它会正常工作。当还原
内核
(作为子
内核
)从另一个
内核
(父
内核
)
启动
时,我得到了未指定的
启动
失败错误。如果我从子
内核
删除cg::sync(网格),就不会出现错误。所以,我的问题是:我可以在子
内核
(CUDA动态并行)中使用cooperative_g
浏览 7
提问于2022-01-24
得票数 0
1
回答
原子氢:如何切换
内核
启动
路径
、
打开Atom,
启动
本地ipython
内核
,然后运行文件中的代码。H2在文件的目录中
启动
内核
。完成后,我想重新
启动
内核
并在另一个目录中运行另一个文件。但是氢保留了第一个文件的
内核
路径。有没有办法在氢中“运行文件”,即在文件目录下
启动
一个新的
内核
并运行文件中的所有行?(就像spyder做的那样)
浏览 1
提问于2018-02-08
得票数 2
1
回答
内核
错误[
启动
内核
失败]
、
、
尝试创建新的羡慕,但它只会产生
内核
错误。 我一直在尝试安装新的
内核
,但与此无关。
浏览 26
提问于2019-10-01
得票数 0
回答已采纳
1
回答
影响CUDA
内核
启动
时间的因素有哪些
、
我有一组CUDA
内核
。每个
内核
在不到10微秒的时间内完成它的工作,然而,它的
启动
时间是50-70微秒。我怀疑纹理内存的使用可能是原因,因为它在我的
内核
中使用。有什么建议可以减少CUDA
内核
的
启动
时间吗?一般来说,影响
内核
启动
时间的因素有哪些?
浏览 0
提问于2017-05-11
得票数 1
1
回答
我需要在实时系统上执行
内核
升级。最佳做法?
、
、
但是,当新
内核
出现在GRUB菜单上时,我正在考虑重新
启动
和选择它: 通过编辑配置文件强制GRUB引导新
内核
是最佳实践吗?还是可以手动选择
内核
,因为这个服务器没有频繁地重新
启动
?在我使用uname -r
内核
时,是否可以删除在该
内核
下出现的
内核
?或者关闭和重新
启动
进程会失败吗?
浏览 0
提问于2015-04-26
得票数 -2
回答已采纳
2
回答
在不同版本的
内核
之间切换而不重新
启动
我想在安装在我的系统上的不同版本的
内核
之间进行切换,而不需要重新
启动
。也就是说,如果我目前运行的是'3.0.0-16-generic
内核
,而且我的
内核
也有旧的3.0.0-14-generic,那么我可以切换到3.0.0-14-generic(另一个
内核
),而无需重新
启动
。(我需要进行实时
内核
调试和更改,因此不能重新
启动
)
浏览 0
提问于2012-03-12
得票数 13
回答已采纳
1
回答
是否每个线程都
启动
了动态并行?
、
我想为我的算法之一使用动态并行,我从CPU
启动
一个具有12个块* 512个线程的
内核
,我想知道我何时将使用动态并行,每个线程将
启动
新的
内核
。1,100>>>(x,y);} 这是否意味着我的大约6000个线程中的每个线程都将尝试
启动
或者我的第一个动态
内核
将暂停所有大约6000个线程,
启动
100个线程,然后返回结果,
浏览 1
提问于2013-03-14
得票数 1
回答已采纳
1
回答
如何在OpenCL程序内部
启动
多个
内核
?
、
我正在尝试查看Opencl编程模型在GPU上的性能,现在在测试编程模型时,我必须使用clEnqueueNDkernel()
启动
内核
,我尝试多次调用这个函数,这样我就可以看到它在
启动
两个或四个并发
内核
时的性能我观察到这个程序与
启动
一个
内核
所花费的时间相同,现在我假设它只运行一次
内核
,因为运行两个或四个并发
内核
不可能花费相同的时间。 现在我想知道如何在一个GPU上
启动
多个
内核
。
浏览 1
提问于2014-09-30
得票数 0
回答已采纳
1
回答
Ubuntu17.10
内核
4.13.0-32无法引导
、
、
今天早上,我重新
启动
了我的系统,在它安装了新
内核
之后,发现它没有
启动
(挂在没有磁盘活动的
启动
屏幕上),这让我大吃一惊。关闭
启动
屏幕和安静后,我看到了一堆信息,比如“未能连接到lvmetad,返回到内部扫描”。 我可以
启动
4.13.0-31
内核
。我如何去调试它呢?我发现了很多关于-31
内核
问题的引用,但是没有关于-32
内核
的引用。
浏览 0
提问于2018-02-05
得票数 1
1
回答
并发:短拷贝,长
内核
、
运行并发复制和
内核
操作时:我看到的流示例显示了1:1的关系。(复制时间=
内核
运行时间。)每次
内核
启动
总是有一个拷贝操作(max)吗?或者复制操作独立于
内核
启动
运行?也就是说,如果运行和复制时间是这样的话,我可以在每次
内核
启动
时完成5次复制操作。(我正在尝试计算在
内核
启动
之前有多少复制
浏览 7
提问于2012-11-29
得票数 0
回答已采纳
1
回答
在Matlab中维护CUDA
内核
启动
之间的gpuArray数据
、
我正在使用parallel.gpu.CUDAKernel在Matlab2011a中
启动
CUDA
内核
。我设计了我的代码,使循环中的后续
内核
启动
应该填充相同的gpuArray,但每次
启动
都将其自身限制在gpuArray的一个独特部分。 在执行结束时,整个数组应该是满的。但是,当我使用gather()将内存传输回主机时,只有最后一次
内核
启动
时写入的内存是正确的;其他所有内容都是空的。如果我在中间的某个地方跳出循环,也是如此。我已经通过传入一个指示
内核
迭代的标
浏览 1
提问于2012-04-28
得票数 3
1
回答
我摘下的谷物里的粗靴
、
、
📷这里我是从我删除的最新
内核
启动
。这是我的食物哪里出了问题?
浏览 0
提问于2017-10-29
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Torvalds反对将UEFI安全启动绑定到内核锁定模式
Linux 6.13内核修复AMD Zen1、Zen2启动延迟问题
Linux基金会启动Chromium内核浏览器支持者项目,微软、谷歌加入
Windows 内核和 Linux 内核的区别(二)
Windows 内核和 Linux 内核的区别(一)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券