前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >站在巨人的肩膀上,做AGI时代的基石:读《从零构建向量数据库》有感

站在巨人的肩膀上,做AGI时代的基石:读《从零构建向量数据库》有感

作者头像
花花Binki
发布于 2024-12-26 15:25:38
发布于 2024-12-26 15:25:38
1490
举报
概述
看罗云老师如何用一本书给出 AI 时代数据库的答案!

你是如何选择去读一本技术书的?我想大部分人的答案是因为刚需某些技能的提升,还有一些是来自于对技术的好奇心。是的,我也是这样。

但这次有点意外,缘起自一条视频号的视频

腾讯云向量数据库:AGI时代的角逐者,热血开跑

在这里看到了腾讯云数据库团队的远见,热情。构成了我买下这本书的最后一块拼图。

《从零构建向量数据库》简要目录

这是一本怎样的书

这是一本从 0 到 1 的动手实践的书。本书从第二部分,就完全是代码实操的部分,页码占据了整本书的 65%。

不过,在 0 之前,还是需要掌握一些基础知识,但对于大多数程序员来书,并不是很难懂。

  • 向量

  • 数据库

  • 向量数据库

在以往的认知中,万物皆对象。可对于计算机来说,对象与对象之间的区别就是存储在内存的地址的区别。它并没有明确的认识到“腾讯云”和腾”讯云开发者社区”是什么关系。而当我们用向量来标识万物,就变得有趣起来。因为是科普向,所以作者也是用他和女儿之间的故事来展开介绍。这里不过多解读。

  • 从 0 到 1 再到100

以往的实战书籍,都是按照模块一章一章的实现。而本书则从一开始就有一个可用的基础版本,并持续迭代为支持分布式的较为完备的数据库。以下是第4章第 1 节的架构图(由笔者模仿作图,并非书中原图)

  • 逐行注释,庖丁解牛

本书的数据库是由 C 语言实现的,作为常常用 Java 写业务开发的我,是有点畏惧的。不过作者也考虑到了这一点,书中的绝大部分代码都有详尽的注释。思路也是从为什么到怎么做到最后的这样做的原因,渐进式学习。

  • 案例加持,打通生态

书中的第三部分,是有实战和展望两部分组成。作者像我们展示了两个非常实用的案例,一个是图片查询系统,另一个是知识库管理。除了这些,对于向量的运用,也可以做一个简易推荐系统。

这不是一本书

书本所呈现的就是作者的思想映射。当跳出书本的内容,关注到内容设计,可以看到一个新技术的探索实践以及工程规范的落地流程。腾讯云的向量数据库是去年中旬上线的,从立项到上线只用两个月!书中所述也算是浓缩了这一段的历程。从前期的探索、采用开源的技术快速实现,到后期的性能优化、功能扩展、SDK生态。

所以,这不是一本书,而是一个规范,是一段历史。

最后,我想说

2022年10月,ChatGPT问世,掀起了一波大语言模型趋势。随后的两年里,互联网开始趋之若鹜,有的甚至头脑一热,开始独立创业。我想说,这是一个很好的技术,但他只能是反补传统计算机的不足,并不意味着 AI 迎来了终局(AGI)。所以,在 AI 浪潮中,不妨看看 DB For AI 这一领域。为最后的 AGI 做基石,罗云做到了,腾讯云做到了!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
LV.4
通华科技(大连)后端开发
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档