文档中心>TI-ONE 训练平台>操作指南>开发机>开发机远程 Worker 节点操作指南

开发机远程 Worker 节点操作指南

最近更新时间:2026-04-30 10:18:37

我的收藏

操作场景

为了实现算力资源的灵活调配,开发机提供了远程 Worker 节点动态拉起能力。您可以配置一台小规格的 CPU 开发机进行日常代码开发,当需要进行 GPU 调试时,通过命令行工具按需拉起 GPU Worker 节点。调试完成后可即时销毁该节点。整个过程无需新建开发机或切换开发环境。远程 Worker 节点将复用当前开发机的镜像和共享存储,并支持 SSH 免密登录。

操作步骤

步骤1:创建开发机打开远程 Worker 节点

创建开发机时(参考 创建开发机),您需要在高级设置中启用远程 Worker 节点,启用后您可以通过命令行工具 TICLI 动态挂载/卸载 Worker 节点以提高开发效率。


步骤2:使用 TICLI 管理 Worker 节点

TICLI 是内置在开发机内的命令行工具,用于管理开发机 Worker 节点的生命周期,包括 launch、list / status、stop、remove 等操作。主要命令如下:

launch 启动 Worker

ticli worker launch --cpu <> --gpu <> --gpu-type <型号> --mem <GiB> [--mount ...]
举例:
ticli worker launch \\
--cpu 8 --gpu 1 --gpu-type V100 --mem 32 \\
--mount type=cfs,id=cfs-xxx,path=/,mapping=/home/tione/cfs
参数
必填
说明
--cpu
CPU 核数
--mem
内存 GiB
--gpu
GPU 卡数(0 表示纯 CPU)
--gpu-type
GPU 预付费必填
V100 A100 A800 H800 T4 / P4
--mount
额外挂载,可多次指定。支持 cfs cfs_turbo cos cosfs dataset
注意:
当前版本 Worker 节点的资源组暂时无法指定,默认配置为开发机所在的资源组。

list / status 查询

ticli worker list # 当前开发机下所有 Worker
ticli worker status --id <worker-id>

stop / remove 停止与删除

ticli worker stop --id nw-001,nw-002 # 支持多 ID,逗号或重复 --id
ticli worker remove --id nw-001 # remove 前需先 stop
以上命令均为异步受理,真实状态请用 list / status 查询。

免密 SSH 登录

ssh -i /root/.ssh/ssh_worker_rsa_key -p 2222 root@<WORKER_IP>

Worker 节点闲置回收

开发机内拉起的 Worker 节点亦受到开发机整体闲置回收策略管控,具体的逻辑如下:
若主开发机因触发闲置回收而停止,则 Worker 节点也会自动被回收
若主开发机没有触发闲置回收,但是 Worker 节点触发了闲置回收的条件,则 Worker 节点单独被回收
若主开发机被列为排除策略对象,Worker 节点不受影响,还是会被单独回收
说明:
该功能当前处于 Beta 公测阶段,我们正在持续优化稳定性和性能表现,欢迎您试用并反馈问题。