Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

作者头像
深度学习与Python
发布于 2024-04-13 05:34:09
发布于 2024-04-13 05:34:09
8790
举报
作者 | 凌敏

4 月 8 日,有道知识库问答引擎 QAnything 更新至 1.3.0 版本,该版本带来了两大主要功能升级:发布纯 python 的轻量级的版本,该版本支持在 Mac 上运行,也可以在纯 CPU 机器上运行;同时支持 BM25 + embedding 混合检索,可以实现更精准的语义检索和关键字搜索。本次更新后,QAnything 能为开发者探索大模型落地提供更强大的技术支撑和更流畅的用户体验。

QAnything 系统架构图

QAnything 是网易有道自研的 RAG(Retrieval Augmented Generation) 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。该引擎支持纯本地部署,上传文档数量无上限,问答准确率很高。

GitHub 地址: https://github.com/netease-youdao/QAnything

自今年 1 月开源以来,QAnything 迅速吸引了开发者社区的广泛关注,并多次登上了 GitHub trending 榜单。截至目前,在 GitHub 上 QAnything 已经积累 7000+ 个星标,这反映出了用户对其价值的高度评价。

QAnything 登上 GitHub trending 榜单

此外,QAnything 下载次数已达数万次。其中,语义嵌入排序模型 BCEmbedding 更是每月可达超 60 万次下载。

值得一提的是,QAnything 采用了自研的 BCEmbedding 模型(RAG 系统关键模块)。有道发现,在客服问答以及一些 toB 客户的场景中,OpenAI 的 Ada2 BCEmbedding 检索准确率只有 60%,而其自研的 BCEmbedding 检索准确率可以达到 95%。该模型具有中英双语跨语种能力和多领域覆盖两大特色。

据悉,QAnything 收集了包括教育、医疗、法律、金融、百科、科研论文、客服、通用 QA 等场景的语料,使得模型可以覆盖和支持尽可能多的应用场景,为商业化落地提供了便捷。

目前,QAnything 已在有道多场景中落地。如“有道领世”在 QAnything 的帮助下,凭借海量的升学资料数据,打造出一个“私人 AI 规划师”,能为每个家长和学生提供个性化的服务,展示更加全面、专业、及时的升学规划。面对高考政策、升学路径、学习生活以及职业规划等各类问题,该系统的解答准确率超过 95%。未来随着数据补充和更新,准确率会一直上涨。

与此同时,子曰教育大模型最新应用成果“有道速读”,其核心功能文档问答、文章摘要、要点解读、引文口碑和领域综述,背后驱动也是 QAnything。在其加持下,用户快速理解文档、定位要点等诉求得以快速实现,短短一分钟,万字长文就能拆解得明明白白。除赋能自身业务外,开源后的 QAnything 不断拓宽“朋友圈”。目前已累计为近百家企业赋能,以期让 AI 应用真正进入医疗、物流、办公等多元化场景,为企业、组织和个人带来生产效率的大幅提升。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
崖山数据库智能问答系统:DeepSeek + RAG
近年来,人工智能领域发展迅猛,尤其是大型语言模型(LLM)的突破性进展,正在深刻改变各行各业。DeepSeek AI 作为新兴的人工智能技术代表,凭借其卓越性能和成本优势迅速崭露头角,为数据库管理等领域带来了新的可能性。
用户10349277
2025/05/27
2040
Anything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。
汀丶人工智能
2024/01/24
1.8K0
Anything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
OpenSPG/KAG V0.7发布,多方面优化提升,事实推理效果领先且构建成本降至11%
我们正式发布KAG 0.7版本,本次更新旨在持续提升大模型利用知识库推理问答的一致性、严谨性和精准性,并引入了多项重要功能特性。
可信AI进展
2025/04/21
2980
OpenSPG/KAG V0.7发布,多方面优化提升,事实推理效果领先且构建成本降至11%
一个暴论的结论
在《说个暴论》一文中,我们揭露了当前关于大模型行业的一些乱象和痛点问题,其中重点提到了当前企业私有训练,不能调用外部 API 的情况下,可以利用开源 LLM+RAG 部署的方式,但这种方式的最大痛点是硬件成本和维护成本。而如果能调用 API,完全不用管有几台服务器,可以在任意时间,随意拉高并发量。
腾讯云开发者
2024/12/06
1370
一个暴论的结论
重新思考RAG的相关性:相似≠相关
最近,我在阅读一些关于 RAG系统的资料时,发现了一个有趣的现象:RAG 的相关性问题远比我们想象的要复杂。无论是从数据检索的角度,还是从大模型对相关性的理解来看,RAG 的表现都充满了挑战和机遇。
致Great
2025/01/20
1720
重新思考RAG的相关性:相似≠相关
ragflow v0.19.0震撼发布!跨语言搜索、全新Agent代码组件、图像直显功能全面升级!
随着AI技术和知识管理的快速发展,Ragflow作为开源RAG(Retrieval-Augmented Generation)流程管理平台,再次迎来强劲升级——v0.19.0版本!本次更新覆盖了跨语言搜索、多语言环境适配、全新Agent组件、图像显示方式革新、集成领先AI模型等重磅功能,同时修复了大量细节问题,提升了开发者和用户体验的方方面面。本文将从核心新特性、功能优化、社区贡献、应用场景切入,深度剖析该版本升级亮点,带你全面了解Ragflow v0.19.0的技术魅力和未来价值!
福大大架构师每日一题
2025/05/26
5640
ragflow v0.19.0震撼发布!跨语言搜索、全新Agent代码组件、图像直显功能全面升级!
解码RAG:智谱 RAG 技术的探索与实践
本文整理自 2024 年 5 月 AICon 北京站 【RAG 检索与生成落地实践】专题的同名主题分享。 另外,即将于 8 月 18-19 日举办的 AICon 上海站同样设置了【RAG 落地应用与探索】专题,我们将深入探讨 RAG 的最新进展、成果和实践案例,详细分析面向 RAG 的信息检索创新方法,包括知识抽取、向量化、重排序、混合检索等在不同行业和场景下的微调和优化方法。目前是 8 折购票最后优惠期,感兴趣的同学请访问文末【阅读原文】链接了解详情。
深度学习与Python
2024/06/27
7910
解码RAG:智谱 RAG 技术的探索与实践
通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。
刘旷
2023/07/28
3960
QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。
汀丶人工智能
2024/01/22
2K0
QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
大模型作为产业变革的核心引擎。通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。三者协同演进,不仅攻克了数据时效性、专业适配等核心挑战,更推动行业从效率革新迈向业务重构。本文将解析技术演进脉络、实战经验与未来图景,为读者提供前沿趋势的全局视角与产业升级的实践指引。
腾讯云开发者
2025/04/26
4900
一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
一分钟搭建RAG应用:DeepSeek模型助力企业知识管理新突破
企业中常常存在数据分散的情况,不同部门和系统各自为政,导致信息孤立。这种现象使得员工在需要信息时,往往需要在多个系统中进行搜索,增加了时间成本和难度。
Lion 莱恩呀
2025/02/16
2.4K1
一分钟搭建RAG应用:DeepSeek模型助力企业知识管理新突破
OpenSPG/KAG v0.6 发布,兼顾事实推理与摘要生成,支持用户自定义 Schema
2025 年 1 月 7 日,OpenSPG/KAG 正式发布 v0.6 版本,此次发布带来多个功能更新,包括摘要生成类任务支持、垂域 Schema 管理、可视化知识探查等;用户体验上,提供知识库任务的断点续跑机制,新增用户登录与权限体系、优化构建任务调度;开发者模式下支持不同阶段配置不同模型、支持 schema-constraint 模式抽取等,极大地提升了系统的灵活性、易用性、性能和安全性,为用户提供一个更加强大,且适应多样化应用场景的知识管理平台。
可信AI进展
2025/01/08
8821
OpenSPG/KAG v0.6 发布,兼顾事实推理与摘要生成,支持用户自定义 Schema
QAnything 与 OpenCloudOS 联合打造操作系统 AI 问答解决方案
导语:4 月 26 日,由网易有道开源的 AI 知识库问答平台 QAnything 发布 1.4.0 版本,并集成到 OpenCloudOS 操作系统中,为 OpenCloudOS 用户提供了一键部署 AI 知识问答库的能力。QAnything 是什么,OpenCloudOS 如何与 QAnything 共同联合研发的,怎样在 OpenCloudOS 中使用 QAnything?本文将为大家一一解析。
用户10910210
2024/04/28
6980
QAnything 与 OpenCloudOS 联合打造操作系统 AI 问答解决方案
RAG 技术真的“烂大街”了吗?
大语言模型技术迅猛发展的脚步,正引领着信息检索技术进入一个新的纪元。在这一领域中, RAG 技术将传统信息检索技术与大语言模型技术相结合,为知识理解、知识获取提供了全新的解决方案。然而,尽管 RAG 在很多任务上表现出色,其在深度应用上仍面临诸多挑战。
深度学习与Python
2024/07/24
3530
RAG 技术真的“烂大街”了吗?
大模型微调与RAG检索增强有何区别?从基础原理到案例分析全面详解
如果你一直在跟着Fanstuck博主的脚步探索AI大模型的相关内容,从最初的大模型Prompt工程解析,DeepSeek全面解析,到实际的私有化大模型开发部署,再到深入NL2SQL、知识图谱大模型和ChatBI等更高阶应用.我是Fanstuck,致力于将复杂的技术知识以易懂的方式传递给读者,热衷于分享最新的行业动向和技术趋势。如果你对大模型的创新应用、AI技术发展以及实际落地实践感兴趣,那么请关注Fanstuck。
fanstuck
2025/03/04
1K6
大模型微调与RAG检索增强有何区别?从基础原理到案例分析全面详解
拆解"ES已死"伪命题:Agentic RAG时代搜索引擎的终极形态
最近,某厂商发了一堆公关文章,翻来覆去地炒作 “ES 已死”,“放弃 ES”。这哪是什么正经的技术文章,说白了就是一场算计好的认知陷阱,妥妥的恶意误导。除了把用户带偏,对开源社区来说,有点开创了社区恶意流的先河,吃相难看。咱也犯不着在这没意义的事儿上浪费时间争论,咱直接聚焦到关键问题上:现在 Agentic RAG 都在重塑人机交互模式了,那下一代智能引擎的理想标准到底是啥样?
点火三周
2025/02/06
1510
拆解"ES已死"伪命题:Agentic RAG时代搜索引擎的终极形态
推理模型升级浪潮下,Agentic RAG 如何借力 DeepSeek 实现知识革命?
王昊奋,同济大学特聘研究员、博导、腾讯云 TVP。研究方向包括知识图谱、自然语言处理、对话问答机器人等。长期在一线人工智能公司担任 CTO 之职。是全球最大的中文开放知识图谱联盟 OpenKG 发起人之一。负责主持多项国家级和上海市 AI 相关项目,发表 100 余篇 AI 领域高水平论文,谷歌学术引用 6100 余次,H-index 达到 31。构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过 10 亿人次。目前担任中国计算机学会术语工委副主任,SIGKG 主席,上海秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学 AI 校友会秘书长等社会职位。
TVP官方团队
2025/04/11
2270
推理模型升级浪潮下,Agentic RAG 如何借力 DeepSeek 实现知识革命?
技术前沿综述:RAG领域的重要进展与创新亮点
在已经过去的 2024 年,RAG 的发展可以称得上是风起云涌,我们回顾全年,从多个角度对全年的发展进行总结。 首先用下图镇楼:
汀丶人工智能
2025/04/23
6750
技术前沿综述:RAG领域的重要进展与创新亮点
还只会卷论文吗?70页报告解密顶级大厂如何玩转AI技术(附完整下载链接)
机器之心深入调研网易,发布70页报告深度解密「别人家」的AI技术团队如何驾驭技术、实现业务发展。开始抄作业吧!附下载链接,拿走不谢! 身处「增长要靠技术造」的后移动互联网时代,AI技术团队要如何走出发顶会论文容易,实现业务增长难的怪圈? 面对不断迭代的AI技术,业务团队又应如何挑选合作伙伴,与何种架构思路的AI技术团队合作,才能行之有效地为自身插上AI的翅膀? 在充满无限可能的未来,自带颠覆属性的AI技术又将在哪些方面带来潜在的变革?哪些前沿AI技术值得关注布局? 在联合网易智企团队共同开展了为期数月的调
机器之心
2022/09/26
3670
还只会卷论文吗?70页报告解密顶级大厂如何玩转AI技术(附完整下载链接)
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
在大型语言模型(LLM)引领的革命浪潮中,搜索与大模型的紧密结合已成为推动知识进步的关键要素。作为开源搜索引擎排名第一的 Elasticsearch(ES),结合沉淀多年的文本搜索能力和强大的向量检索能力实现混合搜索,使搜索变得更准、更全、更智能。腾讯云 ES 多年来持续对开源 ES 的性能、成本、稳定性以及分布式架构进行深度增强优化,并在海量规模的云业务中接受考验。腾讯云基于 ES 实现了一站式 RAG 解决方案,具备了 RAG 技术规模化落地能力。本次分享将深入探讨腾讯云 ES 在搜索领域的最新探索,详细解析腾讯云 ES 的一站式 RAG 方案,并介绍围绕该方案架构落地所进行的一系列内核性能和稳定性增强优化措施。
腾讯QQ大数据
2024/12/20
1.2K0
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
推荐阅读
崖山数据库智能问答系统:DeepSeek + RAG
2040
Anything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
1.8K0
OpenSPG/KAG V0.7发布,多方面优化提升,事实推理效果领先且构建成本降至11%
2980
一个暴论的结论
1370
重新思考RAG的相关性:相似≠相关
1720
ragflow v0.19.0震撼发布!跨语言搜索、全新Agent代码组件、图像直显功能全面升级!
5640
解码RAG:智谱 RAG 技术的探索与实践
7910
通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
3960
QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
2K0
一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
4900
一分钟搭建RAG应用:DeepSeek模型助力企业知识管理新突破
2.4K1
OpenSPG/KAG v0.6 发布,兼顾事实推理与摘要生成,支持用户自定义 Schema
8821
QAnything 与 OpenCloudOS 联合打造操作系统 AI 问答解决方案
6980
RAG 技术真的“烂大街”了吗?
3530
大模型微调与RAG检索增强有何区别?从基础原理到案例分析全面详解
1K6
拆解"ES已死"伪命题:Agentic RAG时代搜索引擎的终极形态
1510
推理模型升级浪潮下,Agentic RAG 如何借力 DeepSeek 实现知识革命?
2270
技术前沿综述:RAG领域的重要进展与创新亮点
6750
还只会卷论文吗?70页报告解密顶级大厂如何玩转AI技术(附完整下载链接)
3670
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
1.2K0
相关推荐
崖山数据库智能问答系统:DeepSeek + RAG
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档