什么是基于 LLM 的推理(LLM-based reasoning)?这个问题的答案和讨论本身就足以写成一本书。然而,本书与之不同,目标则是从头开始实现 LLM...
【新智元导读】颠覆LLM预训练认知:预训练token数越多,模型越难调!CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。
近日,一份围绕 LLM 后训练的综述报告收获了不少好评,其整理相关论文和工具的资源库已经收获了超过 700 star。
作者:matrix 被围观: 14 次 发布时间:2025-04-30 分类:零零星星 | 无评论 »
谦合益邦云 | AI框架工程师 (已认证)
Ray是一个高性能的分布式计算框架,在AI和大模型领域得到了广泛应用,OpenAI的训练底层框架就是Ray。Ray提供了统一的分布式计算抽象,可以像在本机上执行...
关于大模型微调的文章已经写过有两篇:大模型微调与RAG检索增强有何区别?从基础原理到案例分析全面详解和一文带你了解大模型微调的前世今生,基础概率和理论原理内容基...
在大语言模型(LLM)迅速发展的时代,文档处理和转换变得尤为重要。当我们需要将各种格式的文档(如 PDF、Word、PowerPoint 等)输入到 LLM 中...
本文主要研究一下Spring AI Alibaba的PlantUMLGenerator
腾讯 | 高级客户端开发工程师 (已认证)
大家好,我是老码小张,一个热衷于探索技术背后原理,并思考如何用技术解决实际问题的开发者。最近我在研究AI代理(#Agent)相关工具时,发现了一款非常实用的开源...
Anthropic 最近发布的两篇论文试图揭示大语言模型内部的运作机制,探讨如何确定可解释的概念,并将其与将这些概念转化为语言的计算“电路”联系起来。论文还描述...
community/memories/spring-ai-alibaba-jdbc-memory/src/main/java/com/alibaba/cloud...
你可以把 llms.txt 理解成给 LLM 看的 robots.txt。robots.txt 告诉爬虫啥能看,llms.txt 则给 LLM 提供优化过的、预...
本文主要研究一下Spring AI Alibaba的RedisChatMemory
本文主要研究一下Spring AI Alibaba的YuQueDocumentReader
通过这三篇论文的分析,我们将能清晰地理解:PRMs 本质上是一种奖励模型,而 MCTS 则是一种搜索策略。它们各自解决不同的问题,却能在大模型推理优化中形成强大...
目前大部分集成大模型开发用作后端响应,基本上生产环境用的都是OpenAI Python 的SDK,我也推荐大家用OpenAI Python 的SDK,统一、规范...
本文主要研究一下Spring AI Alibaba的YoutubeDocumentReader
本文主要研究一下Spring AI Alibaba的OneNoteDocumentReader