LLM - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签LLM

#LLM

LLM 训练能不能少跑一点？Nous Research 的 TST 方法

七牛开发者 7分钟前2026-05-19 17:33:40

大模型预训练的开销非常高，这已经不是新鲜事。随着模型规模的不断扩大，训练数据需求会持续增加，训练周期和算力成本也越来越难以忽视。因此，过去一两年，LLM 研发团...

000

Agent ToolCall 循环怎么定制？PI Extension 与 DeepAgents Middleware 两条岔路深度对比

windealli 7小时前2026-05-19 10:13:36

当你想给 Agent 的 tool_call 循环挂自定义逻辑——拦截、改写、重试、注入工具——会发现两个明星框架选了两条互不重合的范式：PI 用"事件订阅"，...

1000

人机协同蒸馏：LLM实用技术指南

用户11764306 10小时前2026-05-19 07:07:35

案例研究 #1：400MB模型大小，每秒处理2000+词，8小时数据开发时间。在PyData NYC 2023工作坊中，使用LLM在标注期间从Reddit的r/...

1300

人机协同蒸馏：LLM实用技术指南

用户11764306 17小时前2026-05-19 00:02:39

随着自然语言处理领域的进步和新思想的发展，我们看到越来越多高效利用计算资源的方法，从而生产出运行成本更低、更易于控制的人工智能系统。大型语言模型（LLMs）潜力...

800

完整代码仓库的自动生成：图结构如何让LLM突破代码片段的局限

梯度不陡 21小时前2026-05-18 20:25:14

这项工作证明：用结构化的图代替自然语言计划，能让LLM从"写函数"进化到"构建系统"。虽然Feature Tree维护成本高、测试生成仍不足，但其线性扩展能力和...

1900

Code LLM推理步数砍半，准确率反升12%

梯度不陡 21小时前2026-05-18 20:05:38

DeepSeek-R1把推理步数翻倍，BigCodeBench通过率却暴跌27%；Gemini-2.0-FT用更多步数将难题成功率抬升79%。这项研究指出，步数...

2300

FinRpt：LLM多智能体一键生成研报

梯度不陡 21小时前2026-05-18 20:04:05

A股60页研报传统路径=72小时+5万元，FinRpt-Gen把流程压进4分钟，ROUGE-L 49.06分、投资建议命中率55%开源可查。作者让9个AI智能体...

1800

LLM编程助手：效率提升与代码质量的双刃剑

梯度不陡 21小时前2026-05-18 20:00:09

卡内基梅隆大学的最新研究对AI编程助手的实际价值提出了关键性质疑。该论文首次针对以Cursor为代表的LLM智能体助手展开大规模实证评估，通过差异中的差异法这一...

2510

ROSBag分析新突破：MCP服务器让LLM任务完成率达100%

梯度不陡 21小时前2026-05-18 19:59:36

该实现基于Python MCP库与FastAPI框架，每个工具均以模块化函数形式定义，具备明确的输入输出模式，确保了接口的标准化与请求验证的可靠性。这种设计使得...

2010

自主LLM智能体构建：从基础到高效实践

梯度不陡 21小时前2026-05-18 19:51:19

LLM智能体的出现正推动AI从工具向伙伴演进。这类系统具备自主推理能力，能够主动规划任务并参与复杂决策，而非仅被动响应用户指令。作者指出，这一转变类似于“与新物...

3000

用LLM辅助标注超越GPT性能

用户11764306 1天前2026-05-18 15:12:26

视频地址：https://www.youtube.com/watch?v=Ta45SfbZNcM

3210

当AI学会了混淆代码：LLM辅助混淆 vs R8，Android安全的下一个十字路口

陆业聪 1天前2026-05-18 12:55:13

⚠ 我的判断：LLM混淆目前还不具备生产级可靠性。但作为R8混淆之后的额外一层防护——对核心安全模块做LLM重写——是完全可行的思路。关键是要有充分的测试覆盖。

3600

ICML 2026 | 时空数据（Spatial-Temporal）论文总结（下）【天气预报，物理时空，LLM/MLLM等的应用

时空探索之旅 1天前2026-05-18 12:27:24

ICML 2026将在2026年7月6日—11日于韩国首尔（Seoul, South Korea）举行。本文总结了2026 ICML上有关时空数据（Spatia...

5710

颠覆 LLM？Meta 提出 LCM 这个新范式

掘金安东尼 2天前2026-05-17 08:02:22

原因很简单：LLM 只是学会了如何“预测语言”，却没有真正理解语言背后的“概念”与“世界”。

6910

国产大模型杀疯了！DeepSeek V4 开源 1.6 万亿 MoE，推理成本仅 GPT-4 的 1/70

jack.yang 3天前2026-05-16 14:30:38

2026年4月24日，全球人工智能领域迎来一个历史性节点。就在OpenAI高调发布GPT-5.5的同一天，中国AI公司深度求索（DeepSeek）悄然开源了De...

21220

解密 DeepSeek V4：双轴稀疏 MoE + Engram 记忆 + Muon 优化器，如何打造高效万亿模型？

jack.yang 3天前2026-05-16 14:14:44

在人工智能技术迅猛发展的2026年，大语言模型（Large Language Models, LLMs）已成为推动全球科技变革的核心引擎。自2017年Trans...

16020

2026年LLM测试实战新趋势

顾翔 4天前2026-05-15 10:45:01

2026年，大语言模型（LLM）已深度嵌入金融风控、医疗问诊、政务问答、工业知识库等关键场景。但随之而来的，是测试范式的根本性重构——传统基于输入/输出断言的A...

17010

LLM 文件编写：从入门到精通

jhonye

腾讯｜开发工程师 (已认证)

5天前2026-05-14 16:58:34

学习目标：完成本指南后，你将能够独立编写 Skill、Prompt 模板、Tool/Agent 配置等 LLM 友好的工程化文件，并理解每种格式背后的"为什么"...

24120

transformer进阶之路：#4 attention从如何「工作」到「为何」如此高效

AI-Frontiers 5天前2026-05-14 15:42:14

过去几年里，Transformer 彻底改变了 NLP 领域。如今，也被广泛应用于机器人、计算机视觉等领域。

8010

#LLM

LLM 训练能不能少跑一点？Nous Research 的 TST 方法

Agent ToolCall 循环怎么定制？PI Extension 与 DeepAgents Middleware 两条岔路深度对比

人机协同蒸馏：LLM实用技术指南

人机协同蒸馏：LLM实用技术指南

完整代码仓库的自动生成：图结构如何让LLM突破代码片段的局限

Code LLM推理步数砍半，准确率反升12%

FinRpt：LLM多智能体一键生成研报

LLM编程助手：效率提升与代码质量的双刃剑

ROSBag分析新突破：MCP服务器让LLM任务完成率达100%

自主LLM智能体构建：从基础到高效实践

用LLM辅助标注超越GPT性能

当AI学会了混淆代码：LLM辅助混淆 vs R8，Android安全的下一个十字路口

ICML 2026 | 时空数据（Spatial-Temporal）论文总结（下）【天气预报，物理时空，LLM/MLLM等的应用

颠覆 LLM？Meta 提出 LCM 这个新范式

国产大模型杀疯了！DeepSeek V4 开源 1.6 万亿 MoE，推理成本仅 GPT-4 的 1/70

解密 DeepSeek V4：双轴稀疏 MoE + Engram 记忆 + Muon 优化器，如何打造高效万亿模型？

2026年LLM测试实战新趋势

LLM 文件编写：从入门到精通

transformer进阶之路：#4 attention从如何「工作」到「为何」如此高效

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

腾讯技术工程官方号的专栏

皮振伟的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐