DBAI 数据库 AI 节点功能概览

最近更新时间:2026-05-21 14:15:00

我的收藏

简介

说明:
当前 DBAI 处于邀约测试阶段,请 填写邀约测试申请 参与体验。

DBAI(Database AI Node) 是腾讯云数据库 TDSQL Boundless 推出的智能数据节点,旨在为企业多源异构数据提供一站式的 AI 能力底座。DBAI 以非侵入方式接入 MySQL、PostgreSQL、MongoDB、Redis 及对象存储等数据源,通过统一的 SQL 接口对外提供跨源查询、语义检索、库内推理与可视化洞察服务。
DBAI 无需替换或迁移现有数据库实例,通过单一节点即可实现以下核心能力:
多源数据统一访问:消除跨库取数的胶水代码,通过一条 SQL 语句关联多种数据源;
自然语言交互:支持以自然语言方式查询数据,降低非技术人员的数据获取门槛;
多模检索一体化:将数据抽取、向量化、索引构建等 RAG 全链路收敛于节点内部;
AI 推理就地执行:模型训练与推理在数据节点内完成,避免数据搬运与权限边界被穿透。

AI 节点的功能

DBAI 节点由三大功能模块组成,底层共享统一的执行内核与元数据视图,端到端覆盖"查询 — 检索 — 推理 — 渲染"完整链路。

Multi-Model Fabric 多模存储与混合检索

Multi-Model Fabric 面向 RAG、语义检索与多模数据加工场景,将多源异构数据组织为统一的多模检索底座。
自动接入与向量化:自动加载多源数据至节点,并按指定列完成向量化构建;
就地索引构建:对已纳管的库表按需创建向量索引与全文索引;
混合检索:在同一条 SQL 中完成向量检索、全文检索与结构化条件过滤的联合排序;
双向数据流:支持读写对象存储,并将处理结果回写至已接入的数据源。
调用示例:
SELECT id, title, _hybrid_score
FROM hybrid_search(
'docs_mm',
'embedding', PREDICT(bge_large_zh, '如何申请退款'),
'content', '退款 流程',
k => 10,
alpha => 0.6,
prefilter => true
)
WHERE category IN ('refund', 'order')
ORDER BY _hybrid_score DESC;

-- 返回:
-- +----+-------------------+--------------+
-- | id | title | _hybrid_score|
-- +----+-------------------+--------------+
-- | 17 | 退款流程说明 | 0.932 |
-- | 42 | 如何发起退货退款 | 0.891 |
-- | 5 | 订单退款常见问题 | 0.874 |
-- | 31 | 退款到账时间说明 | 0.856 |
-- | 88 | 售后退款政策 | 0.823 |
-- +----+-------------------+--------------+

Data Dive 数据查询与洞察

Data Dive 面向跨库取数与运营分析场景,将数据查询、计算、解读与可视化整合为一次调用。
跨源关联查询:在同一条 SQL 语句中关联 MySQL、PostgreSQL、MongoDB、Redis 等多种数据源;
自然语言转 SQL:将自然语言转换为带 Schema 校验的可执行 SQL,支持复杂查询意图理解;
智能洞察:基于查询结果自动生成趋势分析、排名、异常点识别及结论摘要,以结构化格式输出;
可视化渲染:将查询结果一键生成可交互、可分享的可视化报表页面。
调用示例:
SELECT ai_insight(
'各城市用户的订单量和消费总额分布情况如何?哪个城市消费能力最强?',
format => 'html'
) AS report;

-- 返回:
-- +----------------------------------------------------------------------+
-- | report |
-- +----------------------------------------------------------------------+
-- | https://xxxx.cos.ap-guangzhou.myqcloud.com/reports/city_insight.html |
-- +----------------------------------------------------------------------+


In-Database AI 模型托管与库内推理

In-Database AI 将模型全生命周期管理纳入数据库节点,实现数据零搬运、模型即函数的一体化 AI 能力。
特征工程:提供特征筛选(IV、PSI、Pearson 相关系数)与特征预处理(归一化、One-Hot 编码、缺失值填充、标签编码)能力,预处理逻辑与模型绑定,推理时自动复用,确保训推一致性;
模型训练:内置 Linear Regression、SVR、LightGBM、Random Forest、GBRT、GBDT 共6种经典算法,支持同步与异步两种执行模式,训练产出自动转换为 ONNX 格式存储;
模型导入:支持从对象存储(COS)导入已训练好的 ONNX 格式模型,将外部平台的模型纳入数据库内统一管理;
模型推理:统一基于 ONNX Runtime 执行,支持单条同步推理(在线服务)和批量异步推理(离线批处理),以 SQL 函数形式嵌入任意查询;
模型评估:支持 MSE、RMSE、MAE、R²、MAPE 等主流评估指标,基于测试数据集量化模型效果;
内置预训练模型:预置 BGE、Multilingual-E5、CLIP 等高质量 Embedding 模型,开箱即用,支撑向量化与语义检索;
外部 LLM 调用:支持将外部大语言模型服务注册为数据库内函数,在查询中直接调用文本生成、情感分析、实体抽取等 AI 能力;
模型管理:提供模型列表查看、详情查询、异步任务监控及模型删除等完整生命周期管理操作。
调用示例:
-- 模型训练
CREATE MODEL house_price_lgb
ALGORITHM = 'lightgbm'
OPTIONS (n_estimators = 100, learning_rate = 0.1)
PREPROCESS (
NORMALIZE(area, age, method = 'minmax'),
ONEHOT(district)
)
AS SELECT area, rooms, age, district, price FROM house_data;

-- 模型推理
SELECT id, PREDICT(house_price_lgb, area, rooms, age, district) AS predicted_price
FROM house_data
WHERE city = 'shanghai';

AI 节点的优势

数据零搬迁,架构无侵入

DBAI 节点以适配层方式接入现有数据源,保留原始数据库实例不变,无需引入额外数仓或 ETL 流程。原有数据库的物理隔离与权限边界始终得到保障。

统一 SQL 方言,一站式数据访问

关系型数据库、文档数据库、键值存储及对象存储均通过一套 SQL 方言进行访问。ai_sql()ai_query()ai_insight()predict()embed() 等内建函数使自然语言解析、跨库查询、语义检索与模型推理在同一执行计划中完成。

AI 能力与数据同层,推理不出节点

模型托管于数据节点内部,推理计算与洞察生成均在本地执行,数据全程不出 VPC,有效满足数据合规与安全性要求。

全链路闭环,降低集成复杂度

从数据接入、向量化索引、混合检索到模型推理与结果渲染,全部能力收敛于单一节点,显著降低业务系统的集成复杂度与运维成本。

丰富的业务场景覆盖

跨多源临时分析、运营数据、自动化报表生成
AI Agent 统一数据工具层,覆盖全域多源数据
RAG 检索底座,支撑文本、文档、图片等多模语料
业务派生数据的就地生成与回写(标签、摘要、特征、风险评分等)
风控、推荐、流失预测等中小规模就地建模