产品架构
腾讯云数据库 AI 服务基于 DatabaseClaw 智能运维平台与 Agent Memory 记忆引擎,为用户提供覆盖多引擎的智能数据库诊断与运维能力。整体架构自上而下分为接入层、核心服务层与引擎覆盖层。
接入层
腾讯云数据库 AI 服务提供多种接入方式,满足不同使用场景:
自然语言对话:通过对话式交互完成数据库运维操作与问题诊断。
腾讯云控制台:在控制台集成可视化操作入口。
API / 企微 / 飞书:支持通过 API 调用或企业 IM 工具接入,便于与现有工作流集成。
核心服务层
核心服务层由 DatabaseClaw 智能运维平台和 Agent Memory 两大模块组成。
DatabaseClaw — AI DBA 智能运维平台
DatabaseClaw 基于 OpenClaw 框架构建,内置 Skill 生态与企业级安全管控能力:
Skill 生态与领域 Know-How
通过 Skill 机制将数据库运维知识产品化,各数据库产品通过 Skill 注入能力,主要包括:
Skill 能力 | 说明 |
慢 SQL 诊断 | 执行计划分析,根因定位。 |
CPU 异常分析 | 多源关联,排除法推理。 |
主从延迟诊断 | 复制状态,根因路由。 |
健康巡检 | 50+ 检查项,定时执行。 |
参数调优 | 合理性检查,优化建议。 |
监控关联查询 | 多指标交叉分析。 |
DBA 诊断方法论 | SOUL:50+种根因覆盖。 |
Skill 支持官方内置、SkillHub 社区共享及用户自建三种来源。
安全与企业级管控
能力 | 说明 |
操作分级 | L1 - L4 SQL 语义级管控。 |
高危拦截 | 30 条永久 Deny 规则,防止数据脱敏泄露。 |
权限与审计 | CAM 权限继承,全链路审计。 |
企业级管理 | 团队管控、模版管理、凭证管理。 |
支持 VPC 内部署,确保数据不出域。
Agent Memory
Agent Memory 为腾讯云数据库 AI 服务提供持续学习与经验积累能力,使系统在使用过程中不断增强诊断准确性:
故障历史积累:同类问题秒级匹配复用,减少重复排查。
参数基线记录:自动感知参数异常偏离,及时预警。
业务周期规律:识别业务正常波动,区分真实异常。
团队经验沉淀:将团队运维经验固化为系统能力,不随人员流动丢失。
引擎覆盖层
腾讯云数据库 AI 服务逐步覆盖腾讯云全数据库引擎矩阵,当前已支持:
CDB MySQL
TDSQL-C
Distributed Cache
MongoDB
PostgreSQL
TDSQL 分布式
更多引擎持续接入中。
与 DBbrain 的关系
腾讯云数据库 AI 服务与 DBbrain 协同工作:
DBbrain:作为确定性数据引擎,提供指标采集、性能分析、慢查询统计等确定性数据基座。
腾讯云数据库 AI 服务:基于 DBbrain 数据,叠加智能推理与诊断能力,实现从“看数据”到“给结论”的跃升。
部署架构
腾讯云数据库 AI 服务采用“管理端统一配置、用户端按需创建、VPC 内 Agent 执行”的三层部署架构:
控制面(Control Plane):承载 HTTP API、MySQL 数据库和 WebSocket 连接池,负责实例管理、配置管控和运营分析。
Pod 实例:部署在用户 VPC 内的 TKE 容器集群中,每个 DatabaseClaw 实例对应一个独立的 OpenClaw Pod,包含 Skills 执行引擎、Cron 调度器、LLM 集成和数据源连接。
大模型服务:提供自然语言解析与推理能力,仅传输脱敏后的推理请求,无业务数据外发。
安全部署要点
安全维度 | 说明 |
VPC 内网部署 | Agent 部署在客户 VPC 内,数据不出域。 |
KMS 加密存储 | 数据库凭证通过 KMS 加密,查看时脱敏。 |
L1-L4 操作分级 | 高危运维操作需用户手动确认。 |
高危操作 Deny | IAM 策略显式拒绝销毁、清空、删库。 |
TLS 加密传输 | 与大模型服务之间仅传输脱敏推理请求。 |