大家好,我是工藤学编程 🦉 | 一个正在努力学习的小博主,期待你的关注 |
|---|---|
实战代码系列最新文章😉 | C++实现图书管理系统(Qt C++ GUI界面版) |
SpringBoot实战系列🐷 | 【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案 |
分库分表 | 分库分表之实战-sharding-JDBC分库分表执行流程原理剖析 |
消息队列 | 深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK) |
AI大模型 | 零基础学AI大模型之Milvus核心:分区-分片-段结构全解+最佳实践 |
前情摘要 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 4、零基础学AI大模型之AI大模型常见概念 5、零基础学AI大模型之大模型私有化部署全指南 6、零基础学AI大模型之AI大模型可视化界面 7、零基础学AI大模型之LangChain 8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路 9、零基础学AI大模型之Prompt提示词工程 10、零基础学AI大模型之LangChain-PromptTemplate 11、零基础学AI大模型之ChatModel聊天模型与ChatPromptTemplate实战 12、零基础学AI大模型之LangChain链 13、零基础学AI大模型之Stream流式输出实战 14、零基础学AI大模型之LangChain Output Parser 15、零基础学AI大模型之解析器PydanticOutputParser 16、零基础学AI大模型之大模型的“幻觉” 17、零基础学AI大模型之RAG技术 18、零基础学AI大模型之RAG系统链路解析与Document Loaders多案例实战 19、零基础学AI大模型之LangChain PyPDFLoader实战与PDF图片提取全解析 20、零基础学AI大模型之LangChain WebBaseLoader与Docx2txtLoader实战 21、零基础学AI大模型之RAG系统链路构建:文档切割转换全解析 22、零基础学AI大模型之LangChain 文本分割器实战:CharacterTextSplitter 与 RecursiveCharacterTextSplitter 全解析 23、零基础学AI大模型之Embedding与LLM大模型对比全解析 24、零基础学AI大模型之LangChain Embedding框架全解析 25、零基础学AI大模型之嵌入模型性能优化 26、零基础学AI大模型之向量数据库介绍与技术选型思考 27、零基础学AI大模型之Milvus向量数据库全解析 28、零基础学AI大模型之Milvus核心:分区-分片-段结构全解+最佳实践
上一篇我们吃透了Milvus的“分区-分⽚-段”核心结构,知道了它如何高效组织海量数据。但理论再好,落地才是关键——到底该选哪种部署方式?Linux服务器上怎么快速部署?部署后怎么验证是否成功?今天就来解决这些“落地问题”,从部署架构选型到Linux Docker实战,再到WebUI使用,一步步带你搞定Milvus部署,新手也能跟着做!

Milvus提供多种部署选项,核心是“按需选择”——不同项目规模、不同阶段,对应不同部署方式,不用盲目追求复杂架构。
部署方案 | 适用场景 | 支持数据量 | 核心优势 | 限制 |
|---|---|---|---|---|
Milvus Lite | 快速原型开发、Jupyter Notebook测试、边缘设备 | 最多几百万向量 | 轻量(Python库)、无需复杂部署、一键启动 | 不支持Windows系统、无高可用 |
Milvus Standalone(单机版) | 个人学习、小团队测试、中型项目(非核心业务) | 最高1亿向量 | Docker一键部署、组件集成、支持主从复制高可用 | 横向扩展能力有限 |
Milvus Distributed(分布式版) | 企业级生产、核心业务、大规模数据 | 1亿-千亿向量 | 云原生架构、水平扩展、冗余备份、高性能 | 部署复杂、需K8S集群、运维成本高 |
如果不想自己搭建和运维,直接选择云厂商提供的Milvus服务(如阿里云Milvus),开箱即用,支持弹性扩容,适合企业快速落地。 官方链接:阿里云Milvus文档
不管哪种部署方案(Docker版),核心分层架构都一致,只是分布式版会将组件拆分到不同节点,单机版打包在一个容器中。
┌───────────────────────────────┐
│ Coordinator(协调层) │ → 管理元数据、调度任务、负载均衡
├───────────────┬───────────────┤
│ Query Node │ Data Node │ → 业务层:Query Node处理查询,Data Node处理数据存储
├───────────────┴───────────────┤
│ Object Storage(存储层) │ → 持久化存储:支持MinIO、AWS S3等
└───────────────────────────────┘ 这是最适合新手的部署方式,全程用脚本操作,无需手动配置组件,以阿里云Linux服务器为例(其他Linux发行版通用)。
下载官方整合脚本
curl -sfL https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh -o standalone_embed.sh下载完成后,执行以下命令启动服务(无需修改,直接复制):
# 给脚本执行权限(若提示权限不足时执行)
chmod +x standalone_embed.sh
# 启动Milvus服务
bash standalone_embed.sh start
# 查看Docker容器状态
docker ps | grep milvusnetstat -tuln | grep 19530,若能看到端口监听,说明服务端口已开放。

# 停止Milvus服务
bash standalone_embed.sh stop
# 重启Milvus服务
bash standalone_embed.sh restart
# 删除Milvus服务(含数据,谨慎使用)
bash standalone_embed.sh delete
# 升级Milvus版本(需群内提供新版本脚本)
bash standalone_embed.sh upgradevolumes/milvus文件夹;volumes/milvus文件夹,避免服务器故障导致数据丢失。部署成功后,通过WebUI可快速查看服务状态,无需命令行操作。
打开浏览器,输入地址:http://服务器IP:9091/webui(示例:http://127.0.0.1:9091/webui/)

Milvus WebUI是内置工具,功能简洁,主要用于“验证服务”和“查看基础信息”,不支持数据操作(如创建Collection、插入数据):

若需可视化操作数据(创建Collection、插入向量、执行查询),推荐使用Attu工具(Milvus官方可视化客户端),支持Windows/Mac/Linux,后续会单独出实战教程。