首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具

AgenticAI

专栏成员
95
文章
8689
阅读量
11
订阅数
通过知识图谱可视化增强 LLM 开发与调试
知识图谱在 AI 驱动的应用,尤其是基于大语言模型(LLM)的聊天机器人中扮演着至关重要的角色。这些图谱可以组织海量数据,加快信息检索,提高检索精准度,从而打造更高效、具备上下文理解能力的 AI 响应。数据框架如 LlamaIndex[1] 充当 LLM 与存储相关信息的数据结构之间的桥梁,使开发者能够更轻松地构建 AI 驱动的应用,例如利用 CreateLlama[2]。
AgenticAI
2025-03-21
1000
一文读懂 MCP!大模型如何用它连接世界,打造更智能的 AI Agent?
最近,MCP[1](模型上下文协议,Model Context Protocol)在 AI 圈子里火了起来。然而,很多人对它的概念仍然感到困惑,包括我在最初接触时也是如此。
AgenticAI
2025-03-19
2100
# 一文读懂 MCP!大模型如何用它连接世界,打造更智能的 AI Agent?
最近,MCP(模型上下文协议,Model Context Protocol)在 AI 圈子里火了起来。然而,很多人对它的概念仍然感到困惑,包括我在最初接触时也是如此。
AgenticAI
2025-03-19
7010
清华大学开源赤兔大模型推理引擎,DeepSeek 推理成本减半,吐字效率翻倍
最近 DeepSeek 火爆全网,相信不少同学都看过所谓的清华大学 DeepSeek 提示词教程(笑)。清华大学是真干实事,近日开源最新的大模型推理引擎赤兔(chitu),是一个专注于效率、灵活性和可用性的高性能大语言模型推理框架。
AgenticAI
2025-03-18
680
RAG新SOTA!港中深发布Graph-based RAG统一框架,深度评估现有Graph-based RAG框架!
大型语言模型(LLM)虽具备强大的理解和生成能力,但缺乏外部知识可能导致"幻觉"问题。基于图的检索增强生成(Graph-based RAG)通过将图结构中的外部知识集成至 LLM,有效提升模型的事实准确性、适应性、可解释性与可信度。然而,目前各种基于图的 RAG 方法缺乏统一框架,难以在相同实验环境下系统比较和深入分析。
AgenticAI
2025-03-18
460
RAG天都变了!OpenAI 亲自下场,深夜发布 5 个Agent新功能!新的原型请求接口,开发者必看!
就在今夜,OpenAI 发布了 5 个新的 Agent 功能,都已经上线 API 平台。
AgenticAI
2025-03-18
510
Markify:专为 LLM 优化的开源文档解析神器,轻松破解 PDF 难题!
不论是在 RAG 应用,还是当下时髦的 Deep Research 应用中,多格式文件的解析始终是一大挑战,尤其是 PDF 文件,由于其复杂的结构和多样的排版方式,很多工具在解析时效果参差不齐。虽然市面上有不少 PDF 解析工具,但高质量且统一的解决方案却少之又少。之前我们已通过《破解 PDF 解析难题:RAG 中高效解析复杂 PDF 的最佳选择》和《微软开源的 Markitdown 可将任意文件转换为 Markdown 格式,PDF 解析咋样?》详细评测过现有工具。markitdown[1] 虽然很好地解决了各类格式转换为 Markdown 的问题,但在 PDF 解析上仍显不足。
AgenticAI
2025-03-18
771
深入实战 HippoRAG2:高效索引、查询与 GraphRAG 对比解析
继上文《深度解析仿人脑记忆搜索的HippoRAG2》,我们已经对HippoRAG2有了基本的了解。本篇将更聚焦于实践部分,探讨如何配置和运行HippoRAG2,包括测试评估和索引自定义文档和数据,并分析其成本与运行时间。最后,我们将索引小说《仙逆》,并与我们早期测试GraphRAG的文章《实战微软新一代RAG》在相同问题上的表现进行对比。
AgenticAI
2025-03-18
640
深度解析仿人脑记忆搜索的HippoRAG2,全面对比GraphRAG、KAG、LightRAG和PIKE-RAG,成本缩减12倍
持续获取、组织和利用知识的能力是人类智能的关键特征,而 AI 系统若想充分发挥潜力,也必须具备这一能力。近期,一些 RAG 方法通过引入知识图谱等结构来增强对信息的理解和联想能力,部分弥补了这些不足。然而,这些增强方法在基础事实记忆任务上的表现通常远逊于标准 RAG。HippoRAG 2[1] 基于 HippoRAG 采用的 个性化 PageRank(Personalized PageRank, PPR)算法,并进一步优化了信息整合方式,同时增强了 LLM 在在线检索中的作用。
AgenticAI
2025-03-18
930
刚刚!Open AI GPT-4.5 震撼发布:无须推理也能比肩o3-mini !
就在刚刚,GPT-4.5 研究预览版正式上线!作为Open AI迄今为止最大、最强的聊天模型,GPT-4.5 不仅交互更自然,还展现了“无须推理也能更强大”的惊艳能力,甚至在部分榜单上直接超越了 OpenAI 的 o3-mini。
AgenticAI
2025-03-18
1960
深夜突袭!全球首个混合推理模型发布 Claude 3.7,编程能力登顶!
今天凌晨,Anthropic 正式发布Claude 3.7 Sonnet,全球首个支持双模式推理的 AI 模型,速度与深度兼得:
AgenticAI
2025-03-18
710
速看!DeepSeek开源周第一弹:FlashMLA加速GPU计算!
🚀DeepSeek开源周第一天,发布加速推理的基础设置FlashMLA,DeepSeek为 Hopper GPU 优化高效 MLA 解码内核,支持变长序列,并已投入生产使用。
AgenticAI
2025-03-18
420
马斯克xAI发布新一代大模型Grok3霸榜各个榜单,超越Open AI o1和DeepSeek r1!
马斯克旗下 xAI 公司正式发布 Grok 3 及其推理模型 Grok 3 Reasoning Beta。这款新一代大模型在 10 万块 Nvidia H100 GPU 组成的超大算力集群上训练,财力雄厚,有钱就是任性。
AgenticAI
2025-03-18
760
史上最全DeepSeek私有部署:全量蒸馏量化、异构多机分布式、Win&Mac&Linux、国产卡一键部署
自 DeepSeek R1 发布以来,私有部署需求迅速增长,然而很多教程仍停留在单机量化模型层面,比如基于 Ollama 或 LM Studio 运行蒸馏量化版 DeepSeek R1。这种方式虽然简单,但在实际应用中存在诸多局限:
AgenticAI
2025-03-18
1470
DeepSeek 1.5B蒸馏小模型单项击败OpenAI o1-preview,我看到来了大模型垂域落地的可能!
加州大学伯克利分校的最新研究[1]表明,仅 1.5B 参数的小模型竟然在 AIME(美国数学竞赛) 上击败了 OpenAI 的 o1-preview!他们对 Deepseek-R1-Distilled-Qwen-1.5B 进行了强化学习(RL)训练,在 4 万道数学题 上优化了一个小模型 DeepScaleR。 整个训练仅消耗 3,800 小时 A100 GPU(约 4,500 美元),最终在 AIME 任务上超越 o1-preview! 你可能会问:o1-preview 是通用大模型,而 Qwen-1.5B 只是专门针对数学微调的,这样比较公平吗?但这正是关键!这项研究证明了小模型在垂直领域的巨大潜力——你不需要 DeepSeek 680B 这样的大模型,只需要一个高质量数据集 + 经济实惠的小模型,就能打造强大的专用 AI。
AgenticAI
2025-03-18
1360
仅需7G显存就能蒸馏自己的DeepSeek R1推理小模型
尽管 DeepSeek R1 以 680B 规模和卓越推理能力引发热潮,其庞大参数量却使企业难以大规模部署;相比之下,经过蒸馏处理的轻量专用模型则更契合企业实际应用需求。
AgenticAI
2025-03-18
650
DeepSeek 揭开杭州成功密码:为何 DeepSeek 与宇树科技大火,而南京却沉寂?
杭州,这座历史悠久而又充满现代活力的城市,正以惊人的速度在科技创新的浪潮中崛起。就在近期,来自杭州的 DeepSeek 以其极低的成本、颠覆性的人工智能大模型震撼业界;宇树科技更以一款突破极限的智能机器人,在春晚舞台上演绎出前所未有的科技魅力;而冯骥率领团队打造的《黑神话:悟空》,以恢宏的叙事和精湛的制作水准,引爆全球玩家的热情。
AgenticAI
2025-03-18
850
Gemini 2.0 Flash 正式发布,成功跻身第一梯队?
Gemini 2.0 Flash 正式发布,同时发布 Pro 系列新模型,这一高效模型在性能、推理能力和多模态处理上全面升级,为开发者和用户带来更智能的体验。
AgenticAI
2025-03-18
830
o3-mini是怎么做到价格削减15倍,逼近DeepSeek R1
在上文OpenAI新发布的o3-mini与DeepSeek R1全面对比我们提到o3-mini价格相较o1削减了15倍左右,逼近DeepSeek R1的两倍价格,最终定价每百万输出4.4刀。
AgenticAI
2025-03-18
320
OpenAI新发布的o3-mini与DeepSeek R1全面对比
OpenAI 发布了最新的推理模型——o3-mini,它专为科学、数学、编程等领域优化,提供更快的响应、更高的准确度和更低的成本。与前代 o1-mini 相比,o3-mini 在推理能力上有了显著提升,尤其在复杂问题解决上,测试者偏爱 o3-mini 的答案达 56%,错误率减少了 39%。从今天起,ChatGPT Plus、Team和Pro用户可使用 o3-mini,免费用户也能体验其部分功能。
AgenticAI
2025-03-18
400
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文