前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >faiss v1.11.0全面升级揭秘!RaBitQ震撼来袭,内存映射零拷贝优化,GPU性能爆发,精确相似度搜索新纪元

faiss v1.11.0全面升级揭秘!RaBitQ震撼来袭,内存映射零拷贝优化,GPU性能爆发,精确相似度搜索新纪元

作者头像
福大大架构师每日一题
发布于 2025-05-09 01:43:50
发布于 2025-05-09 01:43:50
770
举报

大家好,作为开源向量检索库领域的佼佼者,facebookresearch的faiss最近发布了 v1.11.0 版本。本次版本不仅带来了全新功能“RaBitQ”实现,更在训练API、索引搜索、分布式训练、内存映射GPU支持等多方面做了诸多优化和修复,极大提升了使用体验和性能表现。本文将带您深入解析faiss v1.11.0的新增亮点、功能改进、性能提升及实际应用价值,让你第一时间掌握这次版本的核心价值!


一、faiss简介回顾

faiss (Facebook AI Similarity Search) 是一个由Facebook Research团队开发的高效相似度搜索及聚类库,广泛应用于海量向量数据的快速近似最近邻(ANN)搜索,常用于推荐系统、图像检索、自然语言处理等领域。faiss支持多种索引结构(如IVF、PQ、HNSW等),且对CPU和GPU均实现了高效的优化。


二、v1.11.0新功能深度解析

1. 重磅新功能 - RaBitQ模块首次亮相

此次版本最大亮点之一是RaBitQ实现——一种新的优化索引结构。

  • • RaBitQ是在传统PQ(Product Quantization)基础上的创新,进一步优化编码和距离计算方式,提升了检索的准确率和速度。
  • • 将RaBitQ集成到Swig绑定的Python接口,通过Python即可方便访问和操作RaBitQ索引属性。
  • • 修复了RaBitQ的序列化问题,保证了模型的稳定加载与保存。

这是向更高精度、高效率迈进的关键一步,特别适合追求精细语义匹配的向量检索场景。

2. 内存映射与零拷贝机制优化

faiss v1.11.0正式回归并改进了内存映射(mmap)和零拷贝的反序列化机制,带来显著的I/O性能提升:

  • • 通过内存映射快速加载大规模索引文件,降低启动时延和内存占用。
  • • 零拷贝技术优化Python绑定,避免不必要的内存复制,整体性能提升明显。

同时,官方加入了带时间戳的索引文件存储路径,避免了多次运行导致文件被覆盖,即使多次迭代训练也能保存完整历史。

3. 训练API功能增强

此次版本针对训练接口做出多项重要改进:

  • • 新增了 is_sphericalnormalize_L2 两个布尔参数,支持训练时是否将向量单独归一化到球面空间,提升了训练的灵活性。
  • • 分布式训练API中也支持了 normalize_l2 参数,更便于大规模集群上的高效训练。

此外支持训练用的余弦距离计算,增强了对不同相似度度量的泛用性。

4. 索引与搜索功能升级

  • • 支持 IndexBinaryFlat 采用新的 SearchParameters 结构,实现了更灵活的搜索参数配置。
  • • 新增了针对HNSW的邻居数量界限检查,提升鲁棒性。
  • • 加入了IVF索引的“分片(sharding)”便捷函数,方便并行和分布式部署。
  • • 新增对Cagra索引和ID映射功能,保证复杂索引结构下ID管理的正确。
  • • Embedding Reader支持非分区列和映射,扩展了索引读取场景。
  • • 新增cosine距离支持,为基于角度的相似度检索提供保障。

5. GPU和多平台支持

  • • 新增MinGW工具链编译支持,除了MSVC让Windows用户更加灵活。
  • • GPU资源管理、kernel实现等细节修复和优化,确保不同架构下的稳定运行。
  • • openBLAS升级到0.3.29,全面兼容ARM架构,强化了faiss在多种硬件上的适用性。

三、细节修复和优化汇总

本次版本大量bug修复和代码质量提升同样值得关注:

  • • 解决向量分片分布算法缺陷,避免数据分布不均影响查询性能。
  • • 修复IndexNSG中int32溢出问题,保证更大规模索引的稳定。
  • • 修正了各种类型错误和类型兼容问题。
  • • 修复GPU测试中的链接问题,及LLVM-19编译器相关的警告与错误。
  • • 解决动态加载和python binding中的各种兼容性问题,提升跨平台稳定性。
  • • 完善了文档(INSTALL.md、README.md、CAGRA docs)和代码注释,提升用户开发体验。

四、升级建议与实战指南

  • 针对已有用户: 强烈建议升级至v1.11.0,尤其如果您有使用PQ系索引、内存映射或GPU功能的需求,升级后将获得明显的性能和稳定性改进。
  • 开发新项目: 可以考虑尝试新的RaBitQ索引能力,结合normalize参数进行更精细控制,适用于精度要求高、数据分布复杂的实际场景。
  • 部署注意事项: 由于文件路径加入时间戳,自动化生产环境可避免文件覆盖问题,更易于回滚和版本管理。 注意MinGW编译支持对windows扩展了灵活性,但仍需根据项目需求选择合适编译方案。

五、总结

faiss v1.11.0版本通过引入RaBitQ新索引,引擎训练接口的智能升级,以及内存映射和零拷贝技术优化,再次巩固了faiss作为顶级相似度搜索库的市场地位。配合丰富的bug修复和平台支持更新,无论是研究人员还是工业用户,都能获得更精准、高效、稳定的索引与搜索体验。

无论您是关注性能极致优化的系统架构师,还是追求功能全面的应用开发者,或是刚入门的faiss爱好者,v1.11.0都值得您尽快一试。官方github地址:https://github.com/facebookresearch/faiss 欢迎大家观看、下载、使用与贡献!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 福大大架构师每日一题 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
weaviate v1.29.7震撼发布!全面升级HuggingFace&Mistral向量化模块,性能与体验双重跃升!
2025年5月13日,伴随着AI应用的不断深入和知识图谱的火热发展,领先的开源向量数据库Weaviate迎来了重要版本v1.29.7的发布。本次升级不仅修复了多个关键模块,特别是广受关注的HuggingFace和Mistral向量化模块,还优化了内存映射(Mmap)使用的指标统计功能,为开发者带来了更稳定、更高效的使用体验。
福大大架构师每日一题
2025/05/14
1060
weaviate v1.29.7震撼发布!全面升级HuggingFace&Mistral向量化模块,性能与体验双重跃升!
使用Faiss进行海量特征的相似度匹配
来源丨https://zhuanlan.zhihu.com/p/210736523
公众号机器学习与AI生成创作
2021/01/08
3.9K0
使用Faiss进行海量特征的相似度匹配
开发 | 揭开Faiss的面纱 探究Facebook相似性搜索工具的原理
AI科技评论按:本月初AI科技评论曾报道Facebook 开源了 AI 相似性搜索工具 Faiss。而在一个月之后的今天,Facebook 发布了对 Faiss 的官方原理介绍。 它是一个能使开发者快速搜索相似多媒体文件的算法库。而该领域一直是传统的搜索引擎的短板。借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search),比此前的最前沿技术快 8.5 倍,并创造出迄今为止学术圈所见最快的、运行于 GPU 的 k-selection 算法。Faceb
AI科技评论
2018/03/12
2K0
开发 | 揭开Faiss的面纱 探究Facebook相似性搜索工具的原理
Faiss:加速大规模数据相似性搜索的利器
在机器学习和数据挖掘领域,相似性搜索是一项基本且重要的任务,它涉及到在大型数据集中找到与特定对象最相似的对象。Faiss是一个由Facebook AI Research开发的库,专门用于高效地进行相似性搜索和聚类,它之所以重要,是因为它提供了一种快速且准确的方式来执行这一任务,尤其是在处理大规模高维向量数据集时。
用户3578099
2024/06/11
9890
Faiss:加速大规模数据相似性搜索的利器
浅谈如何优化 Milvus 性能
Milvus 是全球最快的向量数据库,在最新发布的 Milvus 2.2 benchmark[1] 中,Milvus 相比之前的版本,取得了 50% 以上的性能提升。值得一提的是,在 Master branch 的最新分支中,Milvus 的性能又更进一步,在 1M 向量串行执行的场景下取得了 3ms 以下的延迟,整体 QPS 甚至超过了 ElasticSearch 的 10 倍。那么,如何使用 Milvus 才能达到理想的性能呢?本文暂且不提社区大神贡献的黑科技优化,先聊聊使用 Milvus 过程中的一些经验,以及如何进行性能调优。
Zilliz RDS
2023/01/10
4.3K0
浅谈如何优化 Milvus 性能
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
语义搜索和检索增强生成(RAG)正在彻底改变我们的在线交互方式。实现这些突破性进展的支柱就是向量数据库。选择正确的向量数据库能是一项艰巨的任务。本文为你提供四个重要的开源向量数据库之间的全面比较,希望你能够选择出最符合自己特定需求的数据库。
deephub
2024/04/25
23.3K1
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss
我们日常使用的各种 APP 中的许多功能,都离不开相似度检索技术。比如一个接一个的新闻和视频推荐、各种常见的对话机器人、保护我们日常账号安全的风控系统、能够用哼唱来找到歌曲的听歌识曲,甚至就连外卖配送的最佳路线选择也都有着它的身影。
soulteary
2022/09/03
2.2K0
【向量检索研究系列】产品介绍
向量检索领域有着非常多优秀产品,不同的产品有着各自的特性,适用于不同的场景,接下来将对已了解的8款优秀向量检索产品进行简单的介绍。
码之有理
2022/07/06
3.8K1
【向量检索研究系列】产品介绍
全方位解读 | Facebook的搜索是怎么做的?
今天要和大家分享的论文是来自Facebook的『Embedding based Retrieval in Facebook Search』。
NewBeeNLP
2020/10/21
1.7K0
引领向量数据库技术新变革,Milvus 2.4 正式上线!
作为向量数据库赛道的领军者,Zilliz 一直致力于推动向量技术的进步与创新。本次发布中,Milvus 新增支持基于 NVIDIA 的 GPU 索引—— CUDA 加速图形索引(CAGRA),突破了现有向量搜索的能力。
Zilliz RDS
2024/04/10
6800
引领向量数据库技术新变革,Milvus 2.4 正式上线!
用 Milvus 和 NVIDIA Merlin 搭建高效推荐系统
简单来说,现代推荐系统由训练/推理流水线(pipeline)组成,涉及数据获取、数据预处理、模型训练和调整检索、过滤、排名和评分相关的超参数等多个阶段。走遍这些流程之后,推荐系统能够给出高度个性化的推荐结果,从而提升产品的用户体验。
Zilliz RDS
2023/11/01
4850
用 Milvus 和 NVIDIA Merlin 搭建高效推荐系统
DeepSpeed v0.16.6震撼发布!性能优化+BUG修复全解析,AI训练再提速!
DeepSpeed v0.16.6 正式发布! 微软DeepSpeed团队近日推出了v0.16.6版本,此次更新涵盖了性能优化、BUG修复及新功能支持,进一步提升了大规模AI训练的效率和稳定性。以下是本次更新的详细内容解析!
福大大架构师每日一题
2025/04/18
2110
DeepSpeed v0.16.6震撼发布!性能优化+BUG修复全解析,AI训练再提速!
weaviate v1.30.2发布!全方位优化SegmentIndex,RBAC升级兼容,OpenAI集成更智能!
随着AI和智能搜索技术的迅猛发展,向量数据库在海量数据管理和快速检索中的地位日益凸显。作为领先的开源向量搜索引擎,Weaviate持续以稳定、高效、智能著称。今天,我们迎来了Weaviate v1.30.2版本更新——这是一次专注于性能优化和安全升级的重要版本,涵盖了SegmentIndex底层解析优化、RBAC访问控制升级兼容、多项OpenAI接口改进,以及数据库内核多处细节修复调整。
福大大架构师每日一题
2025/05/05
1480
weaviate v1.30.2发布!全方位优化SegmentIndex,RBAC升级兼容,OpenAI集成更智能!
美团外卖基于GPU的向量检索系统实践
随着大数据和人工智能时代的到来,向量检索的应用场景越来越广泛。在信息检索领域,向量检索可以用于检索系统、推荐系统、问答系统等,通过计算文档和查询向量之间的相似度,快速地找到与用户需求相关的信息。此外,在大语言模型和生成式AI场景,向量索引做为向量数据的底层存储,也得到了广泛的应用。
美团技术团队
2024/04/15
4640
美团外卖基于GPU的向量检索系统实践
Milvus性能优化提速之道:揭秘优化技巧,避开十大误区,确保数据一致性无忧,轻松实现高性能
Milvus 是全球最快的向量数据库,在最新发布的 Milvus 2.2 benchmark中,Milvus 相比之前的版本,取得了 50% 以上的性能提升。值得一提的是,在 Master branch 的最新分支中,Milvus 的性能又更进一步,在 1M 向量串行执行的场景下取得了 3ms 以下的延迟,整体 QPS 甚至超过了 ElasticSearch 的 10 倍。那么,如何使用 Milvus 才能达到理想的性能呢?本文暂且不提社区大神贡献的黑科技优化,先聊聊使用 Milvus 过程中的一些经验,以及如何进行性能调优。
汀丶人工智能
2023/11/15
2.4K0
Milvus性能优化提速之道:揭秘优化技巧,避开十大误区,确保数据一致性无忧,轻松实现高性能
“银河护卫队总部”放大招!Milvus 核心组件再升级,主打就是一个低延迟、高准确度
Knowhere 是什么?如果把向量数据库整体看作漫威银河护卫队宇宙,那么 Knowhere 就是名副其实的总部,它的主要功能是对向量精确搜索其最近邻或通过构建索引进行低延迟、近似的最近邻搜索(ANNS)。
Zilliz RDS
2023/09/09
3900
“银河护卫队总部”放大招!Milvus 核心组件再升级,主打就是一个低延迟、高准确度
weaviate v1.30.0震撼发布:动态配置、多值向量搜索、BM25性能翻倍,AI搜索进入新时代!
🚀 引言 Weaviate 刚刚发布了 v1.30.0 版本,带来了一系列重磅更新!无论是 动态配置管理、多值向量支持,还是 BlockMax WAND 加速的 BM25,这一版本都在性能、灵活性和用户体验上迈出了一大步。如果你是 AI 搜索、RAG(检索增强生成)或向量数据库的开发者,这篇文章将带你深入解析 Weaviate v1.30.0 的核心升级!
福大大架构师每日一题
2025/04/05
1600
weaviate v1.30.0震撼发布:动态配置、多值向量搜索、BM25性能翻倍,AI搜索进入新时代!
【RAG入门必备技能】Faiss框架使用与FaissRetriever实现
faiss是一个Facebook AI团队开源的库,全称为Facebook AI Similarity Search,该开源库针对高维空间中的海量数据(稠密向量),提供了高效且可靠的相似性聚类和检索方法,可支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库
致Great
2024/06/06
3.1K0
【RAG入门必备技能】Faiss框架使用与FaissRetriever实现
火山引擎ByteHouse:如何为OLAP设计高性能向量检索能力?
随着LLM技术应用及落地,数据库需要提高向量分析以及AI支持能力,向量数据库及向量检索等能力“异军突起”,迎来业界持续不断关注。简单来说,向量检索技术以及向量数据库能为 LLM 提供外置的记忆单元,通过提供与问题及历史答案相关联的内容,协助 LLM 返回更准确的答案。
java进阶架构师
2024/05/09
2240
火山引擎ByteHouse:如何为OLAP设计高性能向量检索能力?
复合索引:向量搜索的高级策略
在向量搜索领域,我们拥有多种索引方法和向量处理技术,它们使我们能够在召回率、响应时间和内存使用之间做出权衡。虽然单独使用特定技术如倒排文件(IVF)、乘积量化(PQ)或分层导航小世界(HNSW)通常能够带来满意的结果,但为了实现最佳性能,我们往往采用复合索引。
用户3578099
2024/07/15
5370
复合索引:向量搜索的高级策略
推荐阅读
weaviate v1.29.7震撼发布!全面升级HuggingFace&Mistral向量化模块,性能与体验双重跃升!
1060
使用Faiss进行海量特征的相似度匹配
3.9K0
开发 | 揭开Faiss的面纱 探究Facebook相似性搜索工具的原理
2K0
Faiss:加速大规模数据相似性搜索的利器
9890
浅谈如何优化 Milvus 性能
4.3K0
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
23.3K1
向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss
2.2K0
【向量检索研究系列】产品介绍
3.8K1
全方位解读 | Facebook的搜索是怎么做的?
1.7K0
引领向量数据库技术新变革,Milvus 2.4 正式上线!
6800
用 Milvus 和 NVIDIA Merlin 搭建高效推荐系统
4850
DeepSpeed v0.16.6震撼发布!性能优化+BUG修复全解析,AI训练再提速!
2110
weaviate v1.30.2发布!全方位优化SegmentIndex,RBAC升级兼容,OpenAI集成更智能!
1480
美团外卖基于GPU的向量检索系统实践
4640
Milvus性能优化提速之道:揭秘优化技巧,避开十大误区,确保数据一致性无忧,轻松实现高性能
2.4K0
“银河护卫队总部”放大招!Milvus 核心组件再升级,主打就是一个低延迟、高准确度
3900
weaviate v1.30.0震撼发布:动态配置、多值向量搜索、BM25性能翻倍,AI搜索进入新时代!
1600
【RAG入门必备技能】Faiss框架使用与FaissRetriever实现
3.1K0
火山引擎ByteHouse:如何为OLAP设计高性能向量检索能力?
2240
复合索引:向量搜索的高级策略
5370
相关推荐
weaviate v1.29.7震撼发布!全面升级HuggingFace&Mistral向量化模块,性能与体验双重跃升!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档