山野大叔 - 个人中心 - 腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

山野大叔

LV1

全部文章

# CubeAttn-X：长程检索上为何反而比纯 Transformer 更强？
本文用一张架构对比图，讲清楚一件事：在大模型长程检索这件事上，混合架构（一半线性注意力 + 一半 Softmax）不仅更省内存，而且准确率更高——纯 Softm...
山野大叔 3天前2026-06-14 13:20:28
huggingface-transformers
硬核实战：2.15 倍推理提速！揭秘 LLM 小批量解码的隐形致命坑
在LLM部署中，小批量连续解码（Batch Decode）是线上服务、对话场景最主流的形态。长期以来，业内有一个普遍看法：
山野大叔 7天前2026-06-10 15:56:51
LLM、自动推理、gpu、大模型部署
Sentinel：让 AI 不再"装完工"的宪法自进化架构
过去 18 个月，所有"AI coding agent"——从 Copilot Workspace 到 Cursor 到 Devin——都共享一个致命 bug：
山野大叔 8天前2026-06-09 12:00:34
agent、腾讯技术创作特训营S18、sentinel
CubeAttn｜一篇推翻线性注意力评测惯例的「反常识」发现：U 型失效、种子陷阱与瓶颈定位
大模型的核心瓶颈之一是注意力机制的显存开销——标准 Transformer 要算一个 $L \times L$ 的大矩阵，序列越长越爆炸。
山野大叔 11天前2026-06-06 07:53:50
卷积神经网络、线性回归、huggingface-transformers、腾讯技术创作特训营S18、腾讯云Token Plan
WorkBuddy 智能体成本控制与架构实践
在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中，验证了一个结论：
山野大叔 12天前2026-06-05 16:35:26
LLM、腾讯云智能体开发平台、WorkBuddy、腾讯云Token Plan、腾讯技术创作特训营S18
31%：LLM 修 Bug 的真正天花板？
我们耗时多轮迭代，持续优化 LLM 自动修 Bug 流水线，从数据喂入、评分机制、Bug 分类到任务调度，完成了全链路架构优化。所有前置工程问题悉数解决，流水线...
山野大叔 15天前2026-06-02 12:03:17
coding、LLM、bug

个人简介

山间旷野 | 农民伯伯
AI Native Builder
AIGC
暂未填写学校和专业
暂未填写个人网址
北京
加入社区时间：2021-05-29

个人成就

获得 5 次赞同
文章被阅读 623 次

关注了：11关注者：8