文档中心>高性能应用服务 HAI>快速入门>通过 HAI 可信集群快速部署模型服务

通过 HAI 可信集群快速部署模型服务

最近更新时间:2026-03-17 16:44:32

我的收藏

步骤1:购买前提条件

在购买HAI可信集群资源前,请确保已满足以下条件
注册腾讯云账号,并完成实名认证。
如果您已在腾讯云注册和实名认证,可跳过此步骤。
HAI 可信集群资源按量计费,购买前请确保账户余额充足。具体操作请参见 在线充值 文档。
如您是传统账户,需先进行升级。
如您当前使用的是传统账户,需先完成账户升级后方可购买。
账户类型判断及升级方式请参考 账户类型说明

步骤2:创建 HAI 可信集群


2. 单击新增服务,进入 HAI 可信集群购买页面,按照页面指引,完成集群配置。

服务名称:自定义服务名称,若不填则默认使用服务的实例 ID 替代。
模型:选择您想要部署的模型。单击应用后可预览应用环境配置详情及应用介绍信息。
地域:建议选择靠近目标客户的地域,降低网络延迟、提高您的客户的访问速度。
算力套餐:您可根据自己所需的配置进行选择。算力套餐对应的显存、算力、CPU、内存信息在算力方案卡片进行展示。
副本数:默认单副本。
网络配置:设置服务访问网络方式。
公共网络:适用于快速对外提供服务。
专属 VPC:适用于对网络隔离、安全性和内网互通有要求的业务场景。
KVCache:用于配置是否启用全局共享 KVCache 缓存池。开启后可提升上下文复用效率,优化推理时延。
说明:
该能力正在逐步开放中,具体支持范围请以控制台展示为准。
任务配置费用:展示当前配置下的预估费用,按小时计费,并随配置项调整实时变化。
3. 单击部署服务,并根据页面提示完成支付。
当您付费完成后,即完成了该模型的部署服务。接下来,您可以通过创建资源后生成的调用地址以及您的 token,调用您的模型服务。详情请参见 获取可信集群服务调用信息