TencentOS AI 增强版镜像是腾讯云基于 TencentOS Server 4 面向 AI Agent 智能体等打造的 AI 就绪(AI-Ready)公共镜像,面向 “AI Agent 智能体部署”与“AI 辅助运维” 两大核心场景。
该镜像在标准 TencentOS Server 4 的基础上,预装了以下内容:
腾讯自研 CodeBuddy CLI,通过 shell 方式提供“自然语言对话入口”,是调用运维技能的核心交互界面
AI 智能体(Agent)开发与部署所需的核心组件(Node.js、Docker、pip3 等)
专家运维技能(Skill):TencentOS 专家运维助手和内核宕机分析助手,通过 Shell 对话实现自然语言驱动的智能运维
国内网络环境的镜像加速配置
为什么需要这个镜像
AI Agent 部署:环境搭建耗时
在云服务器上部署 AI 应用(OpenClaw 、Hermes Agent、Dify、Ollama 等),通常需要手动安装 Docker、Node.js、Python、Git 等组件,并配置镜像加速,流程繁琐且容易踩坑。AI 增强版镜像将这些组件预装并调优,开箱即可进入开发部署环节。
AI 辅助运维:解决传统运维四大痛点
痛点 | 现状 | TencentOS AI 增强版解决方案 |
运维门槛高 | 性能分析、网络排查、内核调优等任务需要多年积累的专业经验,初中级运维人员难以独立完成 | 自然语言描述问题,AI 自动选择诊断工具并执行分析 |
宕机分析难 | 内核崩溃(vmcore)分析需要内核开发背景,多数团队依赖少数专家,响应周期长 | 内核宕机分析专家全自动完成 vmcore 分析并生成报告 |
工具分散 | perf、bpftrace、tcpdump、smartctl、crash 等几十种工具各有用法,学习和记忆成本高 | 24项能力统一封装,AI 按需调用,用户无需记忆命令 |
知识碎片化 | 排查经验散落在 Wiki、聊天记录、个人笔记中,难以复用和传承 | 运维经验固化为 Skill,团队共享、持续迭代 |
TencentOS AI 增强版镜像通过预装 CodeBuddy CLI + 专家运维 Skill,将这些分散的工具和经验封装为自然语言可调用的能力,运维人员一句话即可驱动专业级诊断流程。
镜像优势
能力 | 说明 |
自然语言运维入口 | 预装腾讯自研 CodeBuddy CLI,在终端内直接用自然语言对话完成运维操作,零学习成本 |
AI Agent 部署就绪 | Node.js、Docker、pip3、Git、UV 等组件开箱即用,支持一键部署 OpenClaw 、Hermes Agent 等智能体 |
智能运维诊断 | 预装全栈运维诊断专家,覆盖 9 大领域 24 项能力,用自然语言即可完成服务器故障排查 |
内核崩溃分析 | 预装内核宕机分析专家,AI 自动完成 vmcore 崩溃分析并生成报告,无需内核专家运维经验 |
网络加速 | Docker Hub 腾讯云内网加速,AI 镜像拉取速度大幅提升 |
预装组件
基础组件
组件 | 版本 | 说明 |
Node.js | 24 | 通过 NodeSource 官方源安装,开箱可用 |
Python 3 | 3.11 | 随 TencentOS Server 4 基础系统提供 |
Docker CE & Compose | 28 | 含 Docker Compose Plugin,已配置开机自启 |
Git | 2.43 | 支持 git clone 等源码获取操作 |
CodeBuddy CLI | 2.88 | 提供 Shell 方式自然语言对话入口,实现 AI 能力调用 |
AI 运维技能(Skill)
镜像预装以下两个 AI 运维技能,通过 CodeBuddy CLI 自动加载和调用:
技能 | 说明 |
TencentOS 运维助手(tencentos-expert) | 覆盖 9 大运维领域、24 项诊断能力,渐进式披露,按需加载使用 |
TencentOS 宕机分析助手(AiCrasher) | Linux 内核 vmcore 崩溃自动化分析 |
网络加速配置
镜像已预配置腾讯云国内站加速,显著提升依赖下载速度,已将 Docker 的 registry-mirrors 配置为腾讯云内网镜像加速站地址。
使用效果:
docker pull 拉取镜像时默认使用腾讯云内网加速站,下载速度快且稳定。
拉取主流 AI 框架镜像(如 Ollama、Open WebUI、Dify 等)速度大幅提升。
腾讯云 VPC 内网环境下带宽无限制。
应用场景
AI 智能体开发与部署
场景 | 典型工具 | 依赖组件 |
AI Agent 框架 | OpenClaw、Hermes Agent、LangChain、CrewAI、AutoGen、Mastra | Python + pip / Node.js |
AI 应用平台 | Dify、Open WebUI、MaxKB、RAGFlow | Docker + Docker Compose |
本地大模型推理 | Ollama | Docker 或直装 |
AI 编程助手 | CodeBuddy CLI(已预装)、Claude Code、OpenHands、Cline | Node.js + Git |
MCP 服务 | 各类 MCP Server | Node.js / Python |
AI 辅助运维
场景 | 使用的 Skill | 典型用法 |
服务器故障排查 | TencentOS 运维助手 | "磁盘满了帮我看看"、"网络丢包排查一下" |
性能问题定位 | TencentOS 运维助手 | "CPU 热点在哪"、"内存一直涨是不是泄漏了" |
安全合规检查 | TencentOS 运维助手 | "帮我做一下等保三级检查" |
内核崩溃分析 | TencentOS 宕机分析助手 | "分析这个 vmcore,定位崩溃原因" |
安全漏洞查询 | TencentOS 运维助手 | "这个 CVE 影响 TencentOS 4 吗" |
费用说明
镜像本身:免费使用,与标准 TencentOS Server 4 镜像一致
实例资源:按所选实例规格正常计费(vCPU、内存、存储、带宽等)
AI 运维技能(Skill):技能本身免费,通过预装的 CodeBuddy CLI 调用,Token(词元) 按照独立 计费规则 计费。目前腾讯云对普通用户有一定免费额度。
使用指引

启动 CodeBuddy
1. 使用 root 账户登录实例后,执行以下命令切换至 agentuser 用户,启动 CodeBuddy。登录实例请参见 使用 OrcaTerm 方式登录 Linux 实例(推荐)。
说明:部分脚本执行,仅能在 root 权限下,请您根据实际需要切换用户权限。
#切换用户su agentuser
#进入agentuser目录,并启动codebuddycd /home/agentusercodebuddy
2. 根据页面提示配置 CodeBuddy。以下仅为部分参数介绍,详细介绍请参见 CodeBuddy 社区文档。
权限选择:根据自己赋能给 CodeBuddy 权限进行选择,示例选择1。

确定账号区域:根据您购买的 CVM 所在区域对应选择账号区域。

浏览器认证:将认证地址复制到浏览器打开。

账号登录:可以选择微信登录/手机号等方式,登录后,浏览器返回成功提示。此处以个人微信登录为例。

3. 正常使用:此时返回实例命令行,输入您的问题即可开始使用。

快速验证示例
基础环境验证
镜像启动后,可直接运行以下命令验证基础环境:
# 检查预装组件版本node --version # v24.x.xpython3 --version # Python 3.x.xpip3 --version # pip 24.x.xdocker --version # Docker 28.x.xgit --version # git 2.x.x# 快速启动一个 AI 应用(以 OpenHands 为例)pip install openhands
AI 运维技能验证
在终端直接启动 CodeBuddy CLI,用自然语言发起运维诊断:
# 启动 CodeBuddy CLIcodebuddy# 运维诊断示例(在 CodeBuddy 对话中输入)> 帮我看看磁盘空间使用情况,哪些目录占用最多> 服务器网络延迟高,帮我排查一下> 生成一下 CPU 火焰图看看热点> 帮我做一下等保三级安全检查# 宕机分析示例> 分析 vmcore /path/to/vmcore /path/to/vmlinux
说明:AI 运维技能 Skill(TencentOS 运维助手、TencentOS 宕机分析助手)当前为技术预览(Technology Preview)版本,尚未经过大规模的生产环境验证。AI 生成的诊断结论和操作建议仅供参考,用户应在执行任何操作前自行验证其正确性和适用性,并对操作结果承担全部责任。腾讯云不对因使用 AI 运维技能产生的任何直接或间接损失承担责任。
AI 运维技能详解
技能一:TencentOS 运维助手(tencentos-expert)
全栈运维诊断专家由 24 个能力整合而成,覆盖 9 大运维领域,采用按需加载机制,AI 根据用户的自然语言描述,自动匹配最相关的模块进行诊断,采用渐进式披露方式,不会一次性加载全部能力,确保响应速度和上下文精准度。
磁盘与存储(5 项)
能力 | 说明 | 典型场景 |
磁盘空间分析与清理 | 定位大文件、inode 耗尽、日志堆积 | "磁盘满了怎么清理" |
磁盘分区管理 | GPT/MBR 分区创建与调整 | "新磁盘怎么分区" |
文件系统管理 | 格式化、挂载、fstab 配置、fsck 修复 | "挂载点丢了恢复不了" |
LVM 逻辑卷管理 | PV/VG/LV 管理、在线扩容、快照 | "根分区空间不够了扩容" |
磁盘健康检测 | SMART 检测、NVMe 健康、坏块扫描 | "磁盘有 I/O error" |
网络诊断(3 项)
能力 | 说明 | 典型场景 |
网络连通性诊断 | 逐层排查 DNS、路由、防火墙、端口 | "服务器 ping 不通" |
网络丢包排查 | Ring Buffer 溢出、conntrack 满、内核丢包点定位 | "丢包率 5%,不知道哪里丢的" |
网络延迟分析 | mtr 逐跳、TCP 拥塞、bufferbloat、协议栈延迟 | "ping 正常但应用响应慢" |
性能分析(7 项)
能力 | 说明 | 典型场景 |
CPU 火焰图 | perf-prof/perf 采样生成火焰图,支持 Java/D 状态 | "CPU 跑满了不知道热点在哪" |
系统调用热点 | strace/perf trace 分析系统调用耗时与频率 | "某接口延迟 P99 异常高" |
进程调度延迟 | rundelay 分析、cgroup CPU 限流检测 | "容器变慢但 CPU 不高" |
中断均衡排查 | RSS/RPS 哈希分布、softirq 均衡性 | "软中断集中在一个核上" |
文件系统 IO 延迟 | ext4/xfs IO 延迟分析、page cache 效率 | "fsync 特别慢" |
进程文件 IO 追踪 | iotop/bpftrace 追踪进程 IO 行为 | "iowait 高找不到是谁" |
OOM 事件诊断 | OOM killer 日志解析、cgroup 内存限制分析 | "进程突然被杀了" |
内存诊断(1 项)
能力 | 说明 | 典型场景 |
内存泄漏诊断 | VmRSS 跟踪、slab 泄漏、Java 堆分析 | "内存一直涨不释放" |
系统管理(5 项)
能力 | 说明 | 典型场景 |
系统日志分析 | journalctl/dmesg 日志分析与过滤 | "系统报错了帮我看看" |
服务状态管理 | systemctl 服务排查、启动失败分析 | "nginx 起不来" |
时间同步管理 | NTP/chrony 配置与排查 | "服务器时间不对" |
软件包版本管理 | RPM/dnf 包管理、安全更新 | "怎么升级某个软件包" |
软件源配置 | yum/dnf/pip/npm 源切换与配置 | "yum 源用不了" |
安全合规(2 项)
能力 | 说明 | 典型场景 |
等保三级安全加固 | 基于 GB/T 22239 标准,37 项检查,支持检查/加固双模式 | "过等保前帮我检查一下" |
CVE 漏洞查询 | 查询 TencentOS/OpenCloudOS 安全公告,批量 CVE 匹配 | "这个 CVE 影响我们吗" |
故障恢复(1 项)
能力 | 说明 | 典型场景 |
kdump 配置与排查 | crashkernel 参数配置、kdump 服务排查 | "kdump 没有生成 vmcore" |
技术信息查询(1 项)
能力 | 说明 | 典型场景 |
TencentOS 技术文档查询 | TencentOS 版本信息、维护周期、CentOS 迁移指南 | "TencentOS 4 支持到什么时候" |
工作原理

安全机制
仅执行诊断命令(查看、分析),执行任何写操作需要用户确认。
涉及数据变更的操作(格式化、删除、重启服务等)仅作为建议提供,由用户手动执行。
首次运行时自动安装诊断工具依赖(perf、bpftrace、tcpdump、smartmontools 等)。
技能二:内核宕机分析专家
内核宕机分析专家(AiCrasher)是一个结合 AI 与 Linux crash 工具的自动化内核崩溃分析系统。传统的 vmcore 崩溃分析通常需要内核开发经验,门槛极高。该技能通过分析 vmcore 文件,AI 自动完成从信息收集、崩溃类型识别、根因定位到报告生成的全流程分析。
核心能力
能力 | 说明 |
全自动分析流程 | 从环境准备到报告输出的 7 阶段完整工作流,无需人工逐步操作 |
全类型崩溃覆盖 | 支持 Hung Task、Soft/Hard Lockup、BUG_ON、NULL 指针、OOM、SysRq 触发等常见内核崩溃类型 |
社区补丁关联 | 自动搜索上游 Linux 内核社区的 fix commit,并检查发行版是否已修复 |
结构化分析报告 | 自动生成 Markdown + HTML 格式的分析报告,含完整证据链和修复建议 |
常见问题
AI 运维技能需要额外付费吗?
AI 运维技能会自动执行危险操作吗?
不会。全栈运维诊断专家严格遵循安全原则,AI 只执行诊断类命令(查看、分析),涉及数据变更的操作(格式化、删除、重启服务等)仅作为建议提供给用户,由用户手动确认和执行。
宕机分析需要什么前置条件?
需要 vmcore 文件和对应的 vmlinux(内核调试符号文件)。建议提前开启 kdump 服务,确保系统崩溃时能自动生成 vmcore。
可以只使用基础组件,不使用 AI 运维技能吗?
完全可以。AI 运维技能只在通过 CodeBuddy CLI 调用时才会工作,不使用时不会占用系统资源,也不会影响其他工作负载。
这个镜像和标准 TencentOS Server 4 有什么区别?
AI 镜像在标准镜像基础上预装了 Node.js、Docker-ce、pip3 等 AI 开发常用组件以及 CodeBuddy,并配置了国内镜像加速,内核和系统底层完全一致。
我可以在这个镜像上安装其他软件吗?
完全可以。AI 镜像只是在标准系统上增加了预装软件,不影响正常的 dnf install 等包管理操作。
Docker Hub 加速只在腾讯云内网生效吗?
mirror.ccs.tencentyun.com为腾讯云内网加速地址,在腾讯云 VPC 网络内可获得最佳速度。如需公网访问,可根据实际情况替换为其他公网加速地址。Node.js 为什么选择 24.x 版本?
Node.js 24.x 是当前最新的 LTS 版本,主流 AI Agent 框架(如 OpenClaw、Mastra、CopilotKit、Vercel AI SDK 等)均要求 Node.js 18+,选择 24.x 可确保最大兼容性。