腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
slurm
停止
作业
的
访问
原因
有没有办法找出
slurm
取消
作业
的
原因
?我想将达到资源限制
的
情况与所有其他
原因
(如手动取消)区分开来。如果达到了资源限制,我也想知道是哪一个。
浏览 12
提问于2017-07-28
得票数 1
回答已采纳
1
回答
Cgroup和
Slurm
、
我知道如何使用cgroups(分配内存、cpu使用率...)和
slurm
(提交、挂起/
停止
作业
)。我想知道cgroups是如何使用
slurm
的
。当我向
slurm
提交
作业
时,我可以在哪里修复内存或CPU使用率?我阅读了
Slurm
Schedmd()
的
文档,但它没有给出很好
的
解释。也许这是对我
的
误解。谁能解释一下如何使用
slurm
中
的
cgroup为
作
浏览 4
提问于2017-05-22
得票数 3
1
回答
如何在设置工作目录之前为
Slurm
作业
创建一个新目录?
、
、
、
我想为我运行
的
每个
Slurm
作业
创建一个唯一
的
目录。然而,mkdir似乎中断了SBATCH命令。当我试着:mkdir /path/to/my_dir_$
SLURM
_JOB_ID touch te
浏览 1
提问于2020-12-10
得票数 2
回答已采纳
1
回答
SLURM
和连续
作业
、
、
我尝试使用
SLURM
设置连续
的
作业
,但失败了。下面是我是如何进行
的
: cd ../$NEXT_DIR sbatch run.npt 有人
浏览 0
提问于2015-04-02
得票数 1
1
回答
是否可以强制
SLURM
只
访问
作业
的
运行文件夹而不更改任何其他文件?
我观察到,当我运行
SLURM
作业
时,它可以在其他文件夹路径上创建文件,也可以删除它们。通过
SLURM
作业
,他们可以
访问
其他文件夹/文件并对其进行更改,这似乎很危险。/bin/bash#SBATCH -e
slurm
.err # STDERRecho hello >~/completed.txt rm ~/compl
浏览 5
提问于2017-06-14
得票数 3
回答已采纳
1
回答
由
Slurm
作业
启动
的
所有进程是否在取消
作业
时被终止?
、
如果
Slurm
作业
启动进程(甚至可能是守护进程),如果我使用scancel
停止
该
作业
,它们是否都会自动终止?
浏览 36
提问于2019-11-05
得票数 0
1
回答
SLURM
需要GPU资源请求
是否有一种方法要求
作业
具有--gres=gpu:X对S批处理和运行
作业
提交?要么让
作业
需要该标志,要么设置每个
作业
(如DefMemPerNode )
的
默认gpus数。我
的
slurm
.conf当前设置为SelectType=select/cons_res SelectTypeParameters=CR_Core如果没有办法通过
slurm
配置,是否有办法强迫gpu使用仅通过<e
浏览 4
提问于2022-02-15
得票数 0
3
回答
如何在
SLURM
中查找提交
作业
的
位置?
、
、
我通过
SLURM
向我们学校
的
HPC集群提交了几个工作。因为所有shell脚本都具有相同
的
名称,所以
作业
名称看起来完全相同。RUNNING 0:0 如何知道
作业
是从哪个目录提交
的
,以便区分
作业
?
浏览 0
提问于2014-07-05
得票数 15
回答已采纳
1
回答
SLURM
:当我们重新启动节点时,jobID分配是否从0开始?
例如:因此,似乎提交
的
批处理
作业
覆盖了以前
作业
的
信息,而我不想这样做。 Q当我们重新启动节点时,jobID分配是否从0开
浏览 4
提问于2017-04-28
得票数 1
1
回答
slurm
作业
阵列与
作业
步骤绩效
的
差异
、
、
我在
slurm
中运行了一组并行
作业
(大约1000),每个任务都必须分配给一个CPU。阅读,我发现了以下内容: 考虑将相关工作放入具有多个
作业
步骤
的
单一
Slurm
作业
中,这既是出于性能
原因
,也是为了便于管理。每个
Slurm
作业
可以包含多个
作业
步骤,而
Slurm
中用于管理
作业
步骤
的
开销要比单个
作业
低得多。
作业
浏览 4
提问于2019-07-25
得票数 4
回答已采纳
1
回答
从
SLURM
理解MaxRSS
我以为MaxRSS是用来理解
SLURM
作业
的
内存需求
的
;然而,现在我在质疑自己。 我使用sacct来检查
作业
失败
的
原因
;但是,它似乎由于OOM这看起来很奇怪,因为它只尝试使用请求
的
1.61 Gb
的
3
浏览 4
提问于2020-10-26
得票数 4
回答已采纳
2
回答
通过python与
slurm
交互(自动链接
作业
)
、
、
、
我需要在
slurm
上运行10,000个
作业
(假设每个
作业
需要30分钟)。目前
的
计划是使用
作业
数组,并行使用250个内核,如下所示:不幸
的
是,sys管理员并没有改变
slurm
的
MaxArraySize(从默认
的
1001)。我对bash不是很有经验,而且我对所有东西都有一个python包装器,所以我想我应该用python (另外,我在job
浏览 2
提问于2017-09-22
得票数 0
1
回答
使用依赖项链接多个
SLURM
作业
、
是
作业
A
的
id,:+5表示它将在
作业
A之后五分钟启动。sbatch jobA.
slurm
将返回Submitted batch job 123456,我需要将
作业
id传递给除了第一个
作业
之外
的
所有依赖项
的
调用。由于我使用
的
是一个繁忙
的
集群,我不能依赖于将
作业
ids递增1,因为有人可能会在两者之间排队
作业
。 因此,我想写一个接受
作业
脚本
的
脚本( (*
浏览 86
提问于2021-01-12
得票数 1
回答已采纳
1
回答
在
SLURM
中运行一个大MPI
作业
后
的
顺序任务
、
、
我有一个
slurm
作业
,我使用批处理脚本启动它,例如:例如,是否可以:我在考虑在最后一步使用一个salloc呼叫。
浏览 2
提问于2017-09-10
得票数 2
回答已采纳
1
回答
调度比MaxArraySize更多
的
任务
我想使用
Slurm
来调度和运行这些命令。然而,MaxArraySize
的
限制是2000年。因此,我不能使用一个
作业
数组来调度所有这些任务。给出了一种解决方案,在中,我们创建四个单独
的
作业
,并在文件中使用算术索引,最后一个
作业
有较少
的
任务要运行(233)。 是否可以使用一个带有一个
作业
ID
的
S批处理脚本来完成这个任务?我在使用
作业
数组时设置了ntasks=1。在这种情况下,更大
的
任务有帮助吗?Up
浏览 9
提问于2022-05-10
得票数 1
回答已采纳
2
回答
显示
slurm
作业
的
GPU内存使用情况和利用率
、
我正在使用
slurm
访问
GPU资源。是否可以显示正在运行
的
slurm
作业
的
GPU使用情况?就像在一个普通
的
交互式shell中使用nvidia-smi一样。
浏览 366
提问于2019-12-06
得票数 3
1
回答
如何强迫用户在
slurm
中
的
某个目录中提交
作业
我试图设置
SLURM
,使
SLURM
接受在某个目录中提交
的
作业
,否则拒绝该
作业
。要激活prolog脚本,我已经将
slurm
.conf设置为:/etc/
slurm
/prolog中
的
prolog脚本:if [[ $P
浏览 0
提问于2019-05-04
得票数 1
回答已采纳
1
回答
SLURM
:从脚本
访问
壁时间限制
、
可以从
SLURM
脚本中
访问
壁时间限制吗?对于PBS扭矩,这个问题已经得到了
的
回答。
SLURM
是否有类似的环境值?
浏览 6
提问于2017-05-23
得票数 3
回答已采纳
1
回答
从另一个shell脚本
访问
slurm
退出代码
、
如何从另一个脚本
访问
每个
作业
的
退出代码。我正在尝试自动化这个过程,并使用shell脚本提交成批
的
slurm
作业
。有没有办法
访问
每个
作业
的
退出代码?
浏览 35
提问于2018-05-26
得票数 0
点击加载更多
相关
资讯
换脸软件ZAO的微信分享链接被停止访问
CentOS 停止维护的原因:Red Hat 拒绝为其投资
CentOS停止维护的原因:Red Hat拒绝为其投资
OpenAI停止提供易奉承用户的GPT-4o模型访问服务
java 用httpclient访问https时经常返回403的原因
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券