首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >学习笔记:2025年底参加Vastbase培训感悟(Vastbas.2.2数据库)-关系型数据库)

学习笔记:2025年底参加Vastbase培训感悟(Vastbas.2.2数据库)-关系型数据库)

作者头像
用户7148769
发布2026-06-17 12:25:35
发布2026-06-17 12:25:35
800
举报

时间真快,2025年已经成为历史,,回忆过去的一年,2025年底说忙,真不忙,说不忙,乱七八糟的事一堆,说说2025年底参加Vastbase培训感悟

新修改的《网络安全法》2026年1月1日起施行: ——《党的二十大报告》

网络安全是事关国家安全和国家发展的重大战略问题。我国在网络安全和数据安全方面的战略部署包括:一、是加快建设网络强国、数字中国;二、是完善网络安全法律制度,如网络安全法、数据安全法、个人信息保护法等;三、是提升数据安全治理效能,防范数据泄露、窃取、篡改、滥用等风险;四、是推动信息化迈向数字化、网络化、智能化全面跃升的新阶段。 数据安全法、等保2.0、三权分立、DB4AIAI4DB向量检索要求更加明确,

对关系型数据库Vastbase(S)说陌生又不陌生,说熟练只能说理解操作些,长时间不用都交给老师,听说年底有海量培训,还有考试卷、抱着试试看的心态听听,老师课讲得真不错,在次感谢社区的王艺昕,于洧龙、赵庆辉等老师组织三天Vastbase 2.2培训,一日为师,终生受益,再一次谢谢老师

Vastbase是海量数据基于开源openGauss内核开发的企业级关系型数据库。融合了多年对各行业应用场景的深入理解, Vastbase除了具有openGauss极致的性能以外,还在其原有功能基础上增加了大量对Oracle、MySQL与PostgreSQL的兼容 特性、提供了极佳的业务连续性保障、并遵循EAL4+标准进行了大幅度的安全增强、同时整合GIS空间组件等一系列专业应用领 域的企业级功能,为用户数据库选型提供更高性价比

2025年最后一天参加了培训考试,相关的证书:

Vastbase 的“DB for AI”核心思想是将AI能力内置于数据库引擎中,使开发者能够直接使用熟悉的SQL语言来调用复杂的AI算法,进行模型训练、推理和向量检索,从而降低AI应用开发的门槛和复杂度。这主要通过 DB4AI向量检索 两大核心能力来实现:

一、DB4AI:通过SQL直接调用AI算法

DB4AI 允许在数据库内部直接执行AI计算,无需将数据导出到外部AI平台,实现了数据与AI的无缝集成。这主要通过内置的AI算法包和SQL函数接口来实现。

1.内置行业AI算法包 Vastbase 在数据库内核中集成了特定行业的AI算法,并封装成SQL函数供用户直接调用。例如,提到了一个人脸识别算法的集成示例,它被封装成一个名为 face_detect() 的SQL函数。

l函数功能:输入一张图片的路径,函数会输出图片中识别到的人脸数量。

l内部流程:该函数内部调用了 DetectFace、ExtractFeature、FeatureCompare 等一系列底层AI算法函数,完成了从图像处理、特征提取到特征比对的全过程。

lSQL调用示例

-- 假设存在一个存储图片路径的表 images

SELECT image_path, face_detect(image_path) AS face_count

FROM images;

这条SQL语句会遍历 images 表中的每张图片,并直接返回每张图片中的人脸数量,整个过程在数据库内部完成,无需外部程序介入。

二、原生向量检索:为AI应用提供高效数据基座

“DB for AI”的另一个关键支撑是原生向量引擎。Vastbase 向量版专门为处理高维向量数据(如图像、文本的嵌入表示)而优化,支持高效的相似性搜索,这是构建RAG(检索增强生成)、推荐系统等AI应用的基础。

1.创建向量表与索引 要使用向量检索功能,首先需要创建包含向量列的表,并为该列创建特定的向量索引以加速查询。

l创建包含向量列的表

-- 示例:创建一个知识库文档表,其中embedding列用于存储文本的向量表示

CREATE TABLE docs (

id SERIAL PRIMARY KEY,

chunk TEXT, -- 文档片段

url VARCHAR(255), -- 来源链接

embedding VECTOR(1536) -- 假设使用1536维的向量

);

l创建向量索引:Vastbase 支持多种索引类型以适应不同场景,如IVF(倒排索引)、HNSW(基于图的索引)和DiskANN(磁盘索引)。

-- 示例:为embedding列创建HNSW索引(假设语法)

CREATE INDEX idx_docs_embedding_hnsw ON docs USING hnsw (embedding);

2.执行向量相似性检索 向量检索的核心是计算查询向量与库中所有向量的距离,并返回最相似的Top-K个结果。Vastbase 通过扩展的SQL操作符来支持这一操作。

l基本检索语法:以欧氏距离(L2距离)为例,其SQL语句结构如下:

sql

SELECT

id,

chunk,

embedding <-> '[0.1, 0.2, 0.3, ...]' AS distance -- 计算距离

FROM

docs

ORDER BY

distance -- 按距离排序,越近越相似

LIMIT

10; -- 返回最相似的10条记录

l操作符说明

§<->:代表欧氏距离(L2距离)。

§<#>:代表内积(点积)距离。

§<=>:代表余弦相似度距离。

l混合查询(向量+标量过滤):Vastbase 支持在向量相似性搜索的同时,结合传统的标量(关系型)条件进行过滤,这是其“关系模型+原生向量引擎”混合能力的体现。

-- 示例:在知识库中,不仅要求语义相似,还要求来源URL是特定的

SELECT

id, chunk, url,

embedding <-> '[10, 2.0, ..., 1536.0]' AS distance

FROM

docs

WHERE

url LIKE '%policy%' -- 标量条件过滤

ORDER BY

distance

LIMIT 5;

三、技术优势与实战价值

Vastbase 的“DB for AI”为企业带来了显著价值:

1.降低开发门槛:学习新的查询语言或复杂的AI框架API,使用熟悉的SQL即可构建AI应用,学习成本低。

2.提升开发效率:实现了“语义匹配+条件过滤”的同步执行,告别了以往需要先在向量库中做相似性检索,再将结果在关系库中进行二次过滤的冗余开发流程。

3.保障数据安全与性能:数据无需离开数据库即可完成AI计算,避免了数据迁移带来的安全风险和性能开销。同时,其并行索引构建、PQ量化压缩等技术保障了亿级向量数据下的检索性能。

总结来说,Vastbase V2.2 的特性,通过将AI算法封装为SQL函数、以及提供原生的高效向量检索SQL语法,真正将数据库变成了一个能够直接支撑AI应用开发的智能数据平台。 这使得企业能够更快速、更安全地将大模型、智能推荐等AI能力集成到自己的业务系统中,加速智能化转型,能高效地帮助政府、医疗、教育、制造业等大客户满足最严苛的合规要求,并且已经有很多成功案例

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 黄宏亮数字 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档