时间真快,2025年已经成为历史,,回忆过去的一年,2025年底说忙,真不忙,说不忙,乱七八糟的事一堆,说说2025年底参加Vastbase培训感悟
新修改的《网络安全法》2026年1月1日起施行: ——《党的二十大报告》
网络安全是事关国家安全和国家发展的重大战略问题。我国在网络安全和数据安全方面的战略部署包括:一、是加快建设网络强国、数字中国;二、是完善网络安全法律制度,如网络安全法、数据安全法、个人信息保护法等;三、是提升数据安全治理效能,防范数据泄露、窃取、篡改、滥用等风险;四、是推动信息化迈向数字化、网络化、智能化全面跃升的新阶段。 数据安全法、等保2.0、三权分立、DB4AI 、AI4DB向量检索要求更加明确,
对关系型数据库Vastbase(S)说陌生又不陌生,说熟练只能说理解操作些,长时间不用都交给老师,听说年底有海量培训,还有考试卷、抱着试试看的心态听听,老师课讲得真不错,在次感谢社区的王艺昕,于洧龙、赵庆辉等老师组织三天Vastbase 2.2培训,一日为师,终生受益,再一次谢谢老师
Vastbase是海量数据基于开源openGauss内核开发的企业级关系型数据库。融合了多年对各行业应用场景的深入理解, Vastbase除了具有openGauss极致的性能以外,还在其原有功能基础上增加了大量对Oracle、MySQL与PostgreSQL的兼容 特性、提供了极佳的业务连续性保障、并遵循EAL4+标准进行了大幅度的安全增强、同时整合GIS空间组件等一系列专业应用领 域的企业级功能,为用户数据库选型提供更高性价比

2025年最后一天参加了培训考试,相关的证书:

Vastbase 的“DB for AI”核心思想是将AI能力内置于数据库引擎中,使开发者能够直接使用熟悉的SQL语言来调用复杂的AI算法,进行模型训练、推理和向量检索,从而降低AI应用开发的门槛和复杂度。这主要通过 DB4AI 和 向量检索 两大核心能力来实现:
一、DB4AI:通过SQL直接调用AI算法
DB4AI 允许在数据库内部直接执行AI计算,无需将数据导出到外部AI平台,实现了数据与AI的无缝集成。这主要通过内置的AI算法包和SQL函数接口来实现。
1.内置行业AI算法包 Vastbase 在数据库内核中集成了特定行业的AI算法,并封装成SQL函数供用户直接调用。例如,提到了一个人脸识别算法的集成示例,它被封装成一个名为 face_detect() 的SQL函数。
l函数功能:输入一张图片的路径,函数会输出图片中识别到的人脸数量。
l内部流程:该函数内部调用了 DetectFace、ExtractFeature、FeatureCompare 等一系列底层AI算法函数,完成了从图像处理、特征提取到特征比对的全过程。
lSQL调用示例:
-- 假设存在一个存储图片路径的表 images
SELECT image_path, face_detect(image_path) AS face_count
FROM images;
这条SQL语句会遍历 images 表中的每张图片,并直接返回每张图片中的人脸数量,整个过程在数据库内部完成,无需外部程序介入。
二、原生向量检索:为AI应用提供高效数据基座
“DB for AI”的另一个关键支撑是原生向量引擎。Vastbase 向量版专门为处理高维向量数据(如图像、文本的嵌入表示)而优化,支持高效的相似性搜索,这是构建RAG(检索增强生成)、推荐系统等AI应用的基础。
1.创建向量表与索引 要使用向量检索功能,首先需要创建包含向量列的表,并为该列创建特定的向量索引以加速查询。
l创建包含向量列的表:
-- 示例:创建一个知识库文档表,其中embedding列用于存储文本的向量表示
CREATE TABLE docs (
id SERIAL PRIMARY KEY,
chunk TEXT, -- 文档片段
url VARCHAR(255), -- 来源链接
embedding VECTOR(1536) -- 假设使用1536维的向量
);
l创建向量索引:Vastbase 支持多种索引类型以适应不同场景,如IVF(倒排索引)、HNSW(基于图的索引)和DiskANN(磁盘索引)。
-- 示例:为embedding列创建HNSW索引(假设语法)
CREATE INDEX idx_docs_embedding_hnsw ON docs USING hnsw (embedding);
2.执行向量相似性检索 向量检索的核心是计算查询向量与库中所有向量的距离,并返回最相似的Top-K个结果。Vastbase 通过扩展的SQL操作符来支持这一操作。
l基本检索语法:以欧氏距离(L2距离)为例,其SQL语句结构如下:
sql
SELECT
id,
chunk,
embedding <-> '[0.1, 0.2, 0.3, ...]' AS distance -- 计算距离
FROM
docs
ORDER BY
distance -- 按距离排序,越近越相似
LIMIT
10; -- 返回最相似的10条记录
l操作符说明:
§<->:代表欧氏距离(L2距离)。
§<#>:代表内积(点积)距离。
§<=>:代表余弦相似度距离。
l混合查询(向量+标量过滤):Vastbase 支持在向量相似性搜索的同时,结合传统的标量(关系型)条件进行过滤,这是其“关系模型+原生向量引擎”混合能力的体现。
-- 示例:在知识库中,不仅要求语义相似,还要求来源URL是特定的
SELECT
id, chunk, url,
embedding <-> '[10, 2.0, ..., 1536.0]' AS distance
FROM
docs
WHERE
url LIKE '%policy%' -- 标量条件过滤
ORDER BY
distance
LIMIT 5;
三、技术优势与实战价值
Vastbase 的“DB for AI”为企业带来了显著价值:
1.降低开发门槛:学习新的查询语言或复杂的AI框架API,使用熟悉的SQL即可构建AI应用,学习成本低。
2.提升开发效率:实现了“语义匹配+条件过滤”的同步执行,告别了以往需要先在向量库中做相似性检索,再将结果在关系库中进行二次过滤的冗余开发流程。
3.保障数据安全与性能:数据无需离开数据库即可完成AI计算,避免了数据迁移带来的安全风险和性能开销。同时,其并行索引构建、PQ量化压缩等技术保障了亿级向量数据下的检索性能。
总结来说,Vastbase V2.2 的特性,通过将AI算法封装为SQL函数、以及提供原生的高效向量检索SQL语法,真正将数据库变成了一个能够直接支撑AI应用开发的智能数据平台。 这使得企业能够更快速、更安全地将大模型、智能推荐等AI能力集成到自己的业务系统中,加速智能化转型,能高效地帮助政府、医疗、教育、制造业等大客户满足最严苛的合规要求,并且已经有很多成功案例