Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Milvus 到底有多少种玩法?这份攻略合集请收好!

Milvus 到底有多少种玩法?这份攻略合集请收好!

作者头像
Zilliz RDS
发布于 2021-03-22 03:53:05
发布于 2021-03-22 03:53:05
3.3K0
举报

Milvus 是一款开源的向量相似度搜索引擎,支持使用多种 AI 模型将非结构化数据向量化,并为向量数据提供搜索服务。Milvus 集成了 Faiss、Annoy 等广泛应用的向量索引库,开发者可以针对不同场景选择不同的索引类型。使用 Milvus 就可以以相当低的成本研发出最简可行产品。

在 Milvus 社区中最常遇到的问题之一便是:

我想搭建一个 xx 系统,Milvus 可以实现吗?有没有供参考的项目呢?

其实,项目组已经将许多使用 Milvus 加速 AI 应用的项目在 zilliz-bootcamp 上开放源码。而为了方便大家更加直接和简单地体验 Milvus,我们目前已经在官网上线了涉及 CV、NLP 和计算机听觉等多种领域的 4 个在线应用场景:

?https://zilliz.com/solutions

  • 智能问答系统
  • 以图搜图系统
  • 音频检索系统
  • 视频物体检测系统

本文将介绍上述应用场景的基本原理和使用方法,接下来就让我们开始吧!

应用场景介绍

?智能问答

问答系统是自然语言处理领域中的经典应用场景,可用于回答人们以自然语言形式提出的问题。智能问答系统的经典应用场景包括:智能语音交互、在线客服、知识获取、情感类聊天等。在本应用场景中,我们将 Google 的开源模型 Bert 与向量相似性搜索引擎 Milvus 相结合,快速搭建了一个基于语义理解的智能问答机器人。

?项目源码:https://github.com/zilliz-bootcamp/intelligent_question_answering_v2

使用方法

  1. 上传问答数据集,文件格式为 csv,其中包含 question 和 answer 两列。
  2. 搜索目标问题,召回相似的标准问题。
  3. 点击最相似的问题,得到问题答案。

?使用教程: Milvus 在线问答机器人服务 v2.0

实现原理

数据导入:

  1. 使用 Bert 模型将上传数据集中的标准问题转化为 768 维特征向量存储在 Milvus 中,Milvus 会返回对应 ID。
  2. 将这些问题的 ID 和其对应的答案存储在 PostgreSQL 中。

进行问题搜索时:

  1. 使用 Bert 模型将用户问题转化为特征向量。
  2. 在 Milvus 中对特征向量进行相似度检索,获得与用户问题最相似的标准问题的 ID。
  3. 在 PostgreSQL 得出对应答案。

?以图搜图

想必大家都对“以图搜图”并不陌生,因为这是各类搜索引擎和购物平台中必不可少的功能。事实上,我们可以自己搭建一个以图搜图系统——建立图片库并自己选择一张图片到库中进行搜索,最终得到与其相似的若干图片。在本应用场景中,Milvus 作为一款针对海量特征向量的相似性检索引擎,可以通过结合图片特征提取模型 VGG 轻松实现以图搜图功能功能。

?项目源码:https://github.com/zilliz-bootcamp/image_search

使用方法

  1. 上传图片数据集,文件格式为压缩包,其中只可以包含 jpg 图片。
  2. 上传想要搜索的图片,得到近似图片。

?使用教程:基于 Milvus 的以图搜图系统

实现原理

数据导入:

  1. 使用 VGG 模型将图片转化为 512 维特征向量存储在 Milvus 中,Milvus 会返回对应 ID。
  2. 将这些特征向量的 ID 和对应的图片路径存储在 CacheDB 中。

进行图片搜索时:

  1. 通过 VGG 模型将待搜索图片转化为特征向量。
  2. 在 Milvus 中对待搜索图片的特征向量进行相似度检索,得到 Milvus 库中最相似特征向量对应的 ID。
  3. 在 CacheDB 获得对应的图片。

?音频检索

日常生活中,音频是一种重要的多媒体数据,我们会收听电台节目、欣赏在线音乐等。音频检索技术是智能语音系统的核心,具有十分广泛的应用场景。音频检索技术可以对网络媒体进行实时检索、审查和监控,从而达到保护版权的目的。音频检索技术在音频数据分类与统计中发挥着重要作用。本应用场景利用基于深度学习网络的 PANNs (Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition) 模型提取声音的特征向量,并结合 Milvus 从而提升相似音频的检索效率。

?项目源码:https://github.com/zilliz-bootcamp/audio_search

使用方法

  1. 上传音频数据集,其为只含有有 wav 的压缩文件。
  2. 上传想要搜索的音频,返回相似的音频。

?使用教程:基于 Milvus 的音频检索系统

实现原理

数据导入:

  1. 利用 panns-inference 预训练模型将音频数据转换为特征向量并导入到 Milvus 中,Milvus 将返回向量对应的 ID。
  2. 将返回的 ID 与音频数据的相关信息(如 wav_name)存储到 MySQL 数据库中。

进行音频检索时:

  1. 利用 panns-inference 预训练模型提取待检索音频数据的特征向量。
  2. 在 Milvus 中计算待检索音频数据特征向量与此前导入 Milvus 库中音频数据特征向量的内积距离。
  3. 根据检索返回结果的 ID 在 MySQL 中获取相似音频数据的信息。

?视频物体检测

随着 AI 技术的飞速发展,目标检测和图像处理等技术都在学术界和工业界取得了重大突破。越来越多的 AI 平台都通过集成这些技术,并搭建了许多可以实际应用的系统。本应用场景基于 Milvus 结合了 OpenCV、YOLOv3 和 ResNet50 等技术,从而完成检测视频中物体的任务。

?项目源码:https://github.com/zilliz-bootcamp/video_analysis

使用方法

  1. 上传物品数据集,其文件格式为图片压缩包,图片命名为物体名称。
  2. 数据导入后上传视频,系统对视频进行分析。点击播放视频即可得到每一时刻的物品检测结果。

?使用教程:基于 Milvus 的视频目标检测系统

实现原理

数据导入:

  1. 利用 ResNet50 模型提取数据集中物体特征并转化为 2048 维的向量并存储在 Milvus 中,Milvus 会返回对应 ID。
  2. 将 ID 与对应的名称、物体图片路径存储到 MySQL 数据库中。

进行物体检测时:

  1. 使用 OpenCV 对视频进行截帧处理。
  2. 使用 YOLOv3 网络进行目标检测。
  3. 使用 ResNet50 模型对视频帧中检测到的目标物体图片进行特征提取并转化为向量。
  4. 在 Milvus 中检索物体图像的特征向量,在 MySQL 中得到其对应名称和图片。

看了这么多 Milvus 的应用场景,有没有很心动呢?不如马上行动,来体验一下吧!如果你想与我们分享其它有趣的 Milvus 应用场景,欢迎扫码加入 Milvus 技术交流群~

欢迎加入 Milvus 社区

github.com/milvus-io/milvus | 源码

milvus.io | 官网

milvusio.slack.com | Slack 社区

zhihu.com/org/zilliz-11| 知乎

zilliz.blog.csdn.net | CSDN 博客

space.bilibili.com/478166626 | Bilibili

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-03-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ZILLIZ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于 Milvus 的音频检索系统
人可以通过听觉感知位置、运动、音调、音量、旋律并获取信息。日常生活中,音频是一种重要的多媒体数据,我们会收听电台节目、欣赏在线音乐等。
Zilliz RDS
2021/03/22
1.5K0
基于 Milvus 的音频检索系统
Milvus 与 ONNX 格式的多种模型结合应用
开放神经网络交换(Open Neural Network Exchange,简称 ONNX)是一个开放的生态系统,它提供了基于人工智能模型的一种开源格式。自 2017 年开源以来,ONNX 在短短几年时间内发展为表示人工智能模型的实际标准,提供了一个统一的交互格式,用于优化深度学习和传统的机器学习。ONNX 定义了一组与环境和平台无关的标准格式,实现不同框架之间的互操作性,并简化从研究到生产的路径,有助于提高人工智能社区的创新速度。
Zilliz RDS
2021/08/20
9900
AI听曲识歌!哼曲、口哨吹,都能秒识! ⛵
本文讲解音频检索技术及其广泛的应用场景。以『听曲识歌』为例,技术流程为具对已知歌曲抽取特征并构建特征向量库,而对于待检索的歌曲音频,同样做特征抽取后进行比对和快速匹配。
ShowMeAI
2022/08/26
5K0
AI听曲识歌!哼曲、口哨吹,都能秒识! ⛵
Milvus 实战 | Milvus 与 BERT 搭建文本搜索
Google 的 BERT 模型在 NL 领域中具有巨大的影响力。它是一个通用的语言表示模型,可以应用于诸多领域。本文的项目是将 Milvus 与 BERT 模型结合搭建文本搜索引擎,使用 BERT 模型将文本数据转成向量,结合 Milvus 特征向量相似度搜索引擎可以快速搜索相似文本。
Zilliz RDS
2020/08/05
3K0
Milvus 实战 | Milvus 与 BERT 搭建文本搜索
基于 Milvus 的以图搜图系统 2.0
Milvus 以图搜图 1.0 版本自发布以来便受到广大用户的欢迎。近日,Zilliz 推出了 Milvus 以图搜图系统 2.0 版。本文将介绍 Milvus 以图搜图系统 2.0 版的主要更新内容。
Zilliz RDS
2021/04/26
3.3K0
Milvus开源向量搜索引擎,轻松搭建以图搜图系统
当您听到“以图搜图”时,是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢?事实上,您完全可以搭建一个属于自己的以图搜图系统:自己建立图片库;自己选择一张图片到库中进行搜索,并得到与其相似的若干图片。 Milvus 作为一款针对海量特征向量的相似性检索引擎,旨在助力分析日益庞大的非结构化数据,挖掘其背后蕴含的巨大价值。为了让 Milvus 能够应用于相似图片检索的场景,我们基于 Milvus 和图片特征提取模型 VGG 设计了一个以图搜图系统。 正文分为数据准备、系统概览、 VGG 模型、API 介绍、镜像构建、系统部署、界面展示七个部分。数据准备章节介绍以图搜图系统的数据支持情况。系统概览章节展示系统的整体架构。 VGG 模型章节介绍了 VGG 的结构、特点、块结构以及权重参数。 API 介绍章节介绍系统的五个基础功能 API 的工作原理。镜像构建章节介绍如何通过源代码构建客户端和服务器端的 docker 镜像。系统部署章节展示如何三步搭建系统。界面展示章节会展示系统的搜索界面。
Zilliz RDS
2020/03/26
5.1K0
Milvus开源向量搜索引擎,轻松搭建以图搜图系统
相似视频搜索—Opera 的 Milvus 实践
Opera 成立于 1995 年,总部位于挪威奥斯陆,是全球领先的浏览器提供商及数字内容发现和推荐平台领域的先驱。20 多年来,数百万名用户通过 Opera 网页浏览器访问网站、阅读、进行创作以及使用其他网络娱乐功能。
Zilliz RDS
2021/04/12
1.6K1
Milvus 实战|基于 Milvus 的图文检索系统
1. 通过 TIRG(Text Image Residual Gating)模型将图片特征和文本特征转化为多模态特征向量。
Zilliz RDS
2021/05/17
2.7K2
Milvus 实战|基于 Milvus 的图文检索系统
快来体验 Milvus 视频目标检测系统!
想在视频里找到特定目标物吗?那你一定要来试试 Zilliz 最新推出的基于 Milvus 的视频目标检测系统!下面是视频和文字操作介绍:
Zilliz RDS
2021/01/18
5210
快来体验 Milvus 视频目标检测系统!
语义检索系统:基于Milvus 搭建召回系统抽取向量进行检索,加速索引
目标:使用 Milvus 搭建召回系统,然后使用训练好的语义索引模型,抽取向量,插入到 Milvus 中,然后进行检索。
汀丶人工智能
2023/08/02
2.8K0
语义检索系统:基于Milvus 搭建召回系统抽取向量进行检索,加速索引
小 Mil 来了!Milvus 智能问答机器人上线
它究竟有什么功能,又是怎么实现的呢?今天我要带大家来了解这个基于 Milvus 的 FAQ 问答机器人-MilMil。
Zilliz RDS
2021/07/23
8840
小 Mil 来了!Milvus 智能问答机器人上线
基于 Milvus 的 VOVA 拍照购实践
VOVA 是一个面向全球市场的新兴跨境电商平台,专注于外贸出口,客户遍布六大洲一百多个国家和地区。VOVA 支持 20 种主流语言和 35 种主流货币,拥有数百万件高品质、高性价比的产品,为用户提供最新的全球平价商品和轻松有趣的购物体验。
Zilliz RDS
2021/04/12
5710
Chat with Milvus #11 回顾- 分布式数据库与Milvus分布式
本期的 Milvus 线上问答由我们 15 年经验的数据库专家-顾老师,带你总结主流数据库的发展与未来方向。
Zilliz RDS
2020/05/18
5790
Chat with Milvus #11 回顾- 分布式数据库与Milvus分布式
Milvus 实战|生物多因子认证系列 (一):声纹识别
声纹识别(又称说话人识别)是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的一种生物识别技术。简单来说,声纹识别技术可以“确认说话人是谁”。我们说话的时候,每个人的发音器官、发音通道和发音习惯上都有个体差异,声纹识别技术就是为了识别出说话人之间的这些差异。需要注意的是,声纹识别不同于常见的语音识别 [1]:
Zilliz RDS
2020/06/28
1.8K0
Milvus 实战 | 基于 Milvus 的食谱检索系统
现在,社交媒体、电商网站以及短视频应用源源不断地产生大量多模态数据。这些数据包含了自然语言、视觉信号、声音信号等多种类型。由于单一模式的数据分析已经不能满足日益复杂的查询需求,如何高效利用这些多模态数据变得至关重要。
Zilliz RDS
2020/12/02
1.2K0
Milvus 实战 | 基于 Milvus 的图像查重系统
由于巨大的利益,论文造假屡见不鲜,在部分国家或地区甚至形成了论文造假的产业链。目前大部分论文查重系统只能检查论文文字,不能检查图片。因此,论文图片查重已然成为了学术论文原创性检测的重要部分。
Zilliz RDS
2020/12/16
2.1K0
基于 Milvus 的跨模态行人检索
近年来,由于跨模态数据的快速增长,跨模态检索备受关注。它以一种类型的数据作为查询,来检索另一种类型的相关数据。例如,用户可以用一段文字来检索相关的图片或视频。由于查询及其检索结果可以是不同的模态,如何衡量不同模态数据之间的内容相似性仍然是一个挑战。
Zilliz RDS
2020/11/11
1K0
基于 Milvus 的跨模态行人检索
Milvus 实战|利用 Milvus 搭建基于图的推荐系统
推荐系统[1](Recommender System,RS)能够根据用户的偏好主动为用户推荐商品或项目。它通过用户的历史数据来发掘用户兴趣偏好,从而将用户可能感兴趣的物品推送给用户,一个设计出色的推荐系统能够为企业带来可观的经济效益。
Zilliz RDS
2020/09/24
1.9K0
Milvus 实战|利用 Milvus 搭建基于图的推荐系统
AI 搜房,贝壳找房的Milvus实践
贝壳作为一家房产服务互联网平台,如何在海量房源中选出能够快速成交的房源是对平台和经纪人来说都是一件非常重要同时具有挑战的事情,但是针对房型图,户型信息等一系列非结构化数据在平台中应该怎么搜索呢?
Zilliz RDS
2020/04/28
1.3K0
AI 搜房,贝壳找房的Milvus实践
FastAPI or Flask?从用户出发,才是王道
前段时间,Milvus demo 使用的服务框架从 Flask 切换为 FastAPI,这一改动引发了社区小伙伴们讨论:为什么要改服务框架?改了以后有什么好处?为了解答社区小伙伴们的疑问,Zilliz 数据工程师云梅写下这篇文章。
Zilliz RDS
2021/11/23
3.7K0
推荐阅读
相关推荐
基于 Milvus 的音频检索系统
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档