首页
学习
活动
专区
圈层
工具
发布

#LLM

LLM 训练能不能少跑一点?Nous Research 的 TST 方法

七牛开发者

大模型预训练的开销非常高,这已经不是新鲜事。随着模型规模的不断扩大,训练数据需求会持续增加,训练周期和算力成本也越来越难以忽视。因此,过去一两年,LLM 研发团...

000

Agent ToolCall 循环怎么定制?PI Extension 与 DeepAgents Middleware 两条岔路深度对比

windealli

当你想给 Agent 的 tool_call 循环挂自定义逻辑——拦截、改写、重试、注入工具——会发现两个明星框架选了两条互不重合的范式:PI 用"事件订阅",...

1000

人机协同蒸馏:LLM实用技术指南

用户11764306

案例研究 #1:400MB模型大小,每秒处理2000+词,8小时数据开发时间。在PyData NYC 2023工作坊中,使用LLM在标注期间从Reddit的r/...

1300

人机协同蒸馏:LLM实用技术指南

用户11764306

随着自然语言处理领域的进步和新思想的发展,我们看到越来越多高效利用计算资源的方法,从而生产出运行成本更低、更易于控制的人工智能系统。大型语言模型(LLMs)潜力...

800

完整代码仓库的自动生成:图结构如何让LLM突破代码片段的局限

梯度不陡

这项工作证明:用结构化的图代替自然语言计划,能让LLM从"写函数"进化到"构建系统"。虽然Feature Tree维护成本高、测试生成仍不足,但其线性扩展能力和...

1900

Code LLM推理步数砍半,准确率反升12%

梯度不陡

DeepSeek-R1把推理步数翻倍,BigCodeBench通过率却暴跌27%;Gemini-2.0-FT用更多步数将难题成功率抬升79%。这项研究指出,步数...

2300

FinRpt:LLM多智能体一键生成研报

梯度不陡

A股60页研报传统路径=72小时+5万元,FinRpt-Gen把流程压进4分钟,ROUGE-L 49.06分、投资建议命中率55%开源可查。作者让9个AI智能体...

1800

LLM编程助手:效率提升与代码质量的双刃剑

梯度不陡

卡内基梅隆大学的最新研究对AI编程助手的实际价值提出了关键性质疑。该论文首次针对以Cursor为代表的LLM智能体助手展开大规模实证评估,通过差异中的差异法这一...

2510

ROSBag分析新突破:MCP服务器让LLM任务完成率达100%

梯度不陡

该实现基于Python MCP库与FastAPI框架,每个工具均以模块化函数形式定义,具备明确的输入输出模式,确保了接口的标准化与请求验证的可靠性。这种设计使得...

2010

自主LLM智能体构建:从基础到高效实践

梯度不陡

LLM智能体的出现正推动AI从工具向伙伴演进。这类系统具备自主推理能力,能够主动规划任务并参与复杂决策,而非仅被动响应用户指令。作者指出,这一转变类似于“与新物...

3000

用LLM辅助标注超越GPT性能

用户11764306

视频地址:https://www.youtube.com/watch?v=Ta45SfbZNcM

3210

当AI学会了混淆代码:LLM辅助混淆 vs R8,Android安全的下一个十字路口

陆业聪

⚠ 我的判断:LLM混淆目前还不具备生产级可靠性。但作为R8混淆之后的额外一层防护——对核心安全模块做LLM重写——是完全可行的思路。关键是要有充分的测试覆盖。

3600

ICML 2026 | 时空数据(Spatial-Temporal)论文总结(下)【天气预报,物理时空,LLM/MLLM等的应用

时空探索之旅

ICML 2026将在2026年7月6日—11日于韩国首尔(Seoul, South Korea)举行。本文总结了2026 ICML上有关时空数据(Spatia...

5710

颠覆 LLM?Meta 提出 LCM 这个新范式

掘金安东尼

原因很简单:LLM 只是学会了如何“预测语言”,却没有真正理解语言背后的“概念”与“世界”。

6910

国产大模型杀疯了!DeepSeek V4 开源 1.6 万亿 MoE,推理成本仅 GPT-4 的 1/70

jack.yang

2026年4月24日,全球人工智能领域迎来一个历史性节点。就在OpenAI高调发布GPT-5.5的同一天,中国AI公司深度求索(DeepSeek)悄然开源了De...

21220

解密 DeepSeek V4:双轴稀疏 MoE + Engram 记忆 + Muon 优化器,如何打造高效万亿模型?

jack.yang

在人工智能技术迅猛发展的2026年,大语言模型(Large Language Models, LLMs)已成为推动全球科技变革的核心引擎。自2017年Trans...

16020

2026年LLM测试实战新趋势

顾翔

2026年,大语言模型(LLM)已深度嵌入金融风控、医疗问诊、政务问答、工业知识库等关键场景。但随之而来的,是测试范式的根本性重构——传统基于输入/输出断言的A...

17010

LLM 文件编写:从入门到精通

jhonye

腾讯 | 开发工程师 (已认证)

学习目标:完成本指南后,你将能够独立编写 Skill、Prompt 模板、Tool/Agent 配置等 LLM 友好的工程化文件,并理解每种格式背后的"为什么"...

24120

transformer进阶之路:#4 attention从如何「工作」到「为何」如此高效

AI-Frontiers

过去几年里,Transformer 彻底改变了 NLP 领域。如今,也被广泛应用于机器人、计算机视觉等领域。

8010
领券