
阅读收获
全文概览
过去两年,HBM(高带宽内存)伴随GPU训练集群的爆发式增长,一度被视为存储行业的"皇冠明珠"。SK海力士、三星等巨头纷纷将产能向HBM倾斜,资本市场也对这条赛道给予了极高溢价。然而,当AI的重心从训练转向推理,一个尖锐的问题浮出水面:HBM的高成本,能否支撑大规模推理部署?
2026年FMS(闪存峰会)给出了行业的集体回应。本届峰会上,DRAM与HBM相关的15场路演传递出一个清晰信号:HBM不再是唯一答案。3D DRAM无电容方案将刷新时间从64ms提升至2900ms,LPDDR从移动端向数据中心渗透,MRDIMM在有限插槽上实现内存扩展,HBF(高带宽闪存)作为低成本替代方案进入讨论——这些技术方向共同指向一个更务实的内存架构未来。
本文基于FMS 2026公开日程与演讲材料,梳理DRAM与HBM领域的技术趋势,并结合2024-2026三年峰会的横向对比,试图回答:内存行业的下一站,究竟在哪里?
👉 划线高亮 观点批注

上表 是 FMS26 中与 DRAM 和 HBM 相关路演的日程安排
纵向列了日期、时间、子分类、演讲标题,以及演讲者和机构

总结来看,FMS26 关于DRAM的讨论聚焦在 第二天和 第三天,其中DRAM 的内容都计划在 Day2, 而 HBM 都在 Day3,分别是 11场和 4场
共计 72 个上下游厂商参展。

DRAM 领域的11场的路演分析中细化了 5 个子主题,分别是:
展开来看,在 3D DRAM 领域: 在 26 年的技术峰会中,一个核心的主题是以无电容 DRAM 的创新,将 DRAM 的刷新时间从 64ms 提升到 2900ms。这意味着 DRAM 从原始的高频刷新保证数据驻留的操作上,升级到可以大幅度降低刷新次数,从而减少功耗。这些都是无电容这种新兴半导体设计带来的技术优势。
最近读到国内的内存巨头(CX)发表了一篇新论文,讲到从 1T-1C 当前成熟工艺制程上,如何去扩展 DRAM 的内存容量。提出了纵向堆叠的技术方案,试图通过封装技术的创新,来延长 DRAM 在 2D 领域的技术寿命。反观 2026 年 FMS 话题集中度,主要是一些未来创新型 3D DRAM 的技术探讨。
在低功耗 DDR(LPDDR)领域主要技术趋势是,厂商开始考虑使用 LPDDR 来进行KVCache卸载。关于 KVCache 卸载在 2026 年其实有很多讨论,有说用 SSD 来做的,也有说用 CXL 扩展内存池来做。在 2026 年峰会上提出用 LPDDR 来做,三者底层脉络是:成本会逐渐增加,但是性能也会得到更高保障。LPDDR 原来是低功耗领域的移动端内存,目前的趋势是越来越受到数据中心场景关注。
第三个是 MRDIMM 多路内存设计,成为在有限服务器插槽上实现内存扩展的核心路径。

在 HBM 子主题下,一共有 4 场分析。核心讨论的话题是 HBM 成本分析及其替代方案。
在当下内存海量需求背景下,行业已经意识到,内存厂商把产能都压注在 HBM 上,其实是与市场需求背离的:
因此,如果仍然把产能压注在 HBM 上,就会与整个行业需求产生矛盾。
这也是为什么在今年峰会上,大部分厂商都在讨论如何在应用场景中实现 HBM 成本压降以及替代方案。峰会中提出了“HBM Cost Wall”,HBM 作为GPU的核心成本单元, HBM 的成本正成为 AI 推理规模化的瓶颈。这标志着 HBM 进入了大规模采用前的“成本焦虑期”,促使行业内对更大容量、更低成本方案的讨论。这就包括紧邻的 HBF(高带宽闪存)技术讨论中传递出的信号:HBM 不再是唯一的答案,混合内存策略和 HBF 替代方案正在进入产业的讨论。
我觉得这在内存整个大话题下是一以贯之的。不管是在 DRAM 领域讨论的 3D DRAM,还是 LPDDR 从移动端到数据中心端的转型,本质上都是要以更高的性能,同时以合理的成本去解决或缓解数据中心数据传递过程中的带宽和容量问题。
行业已经充分意识到 HBM 成本是不可持续的。这也是 2026 年与 2024、2025 年行业内观点的差异。
前两年,行业内对 HBM 的景气度其实是非常期待的。作为一个新兴的内存领域,随着 GPU 场景的拓展,很多人都在讨论如何扩展 HBM 的产能和应用。但在 2026 年,整个行业内传递出更加清醒的认知。这也预示着 HBM 未来可能会有更加聚焦的高价值场景。

上表总结了 本次峰会传递出的 DRAM & HBM 领域技术趋势 。 洞察的角度和核心观点在前面也所有论述。

上表 总结了内存领域本次峰会传递出的新技术方向及未来几年的路线图,一共包括 6 个方向:3D DRAM、HBM4、LPDDR6、MRDIMM、HBF 以及混合内存的管理方案。
纵向罗列了未来几年这些技术在成熟过程中的里程碑事件,以及发展中存在的一些关键变量:
关于数据领域的分层设计和-调度优化,其实过去几十年来一直有不同的技术方案讨论,从最早的 NUMA 到多级缓存,再到冷热数据区分,这些都是为了识别计算过程中数据访问的冷热程度,而优化出的内存管理方案。随着 LPDDR 以及 HBF 这些新的存储单元出现,如何设计一套混合的内存管理策略,可能是业界做好统一管理越来越显性化的需求。

上图总结了 24-26 三年 围绕内存领域的技术话题讨论
给我的感触是,内存领域的技术创新随着 GPU 加速计算的范式做快速的适配和转型。
英伟达 GPU + HBM,这一套顶级性能的架构目前来看在训练场景已经奠定了话语权;但是随着从训练转向推理,低成本、大容量的内存方案成为目前业界共同攻坚的领域。
这一块还是处于比较早期的。无论是 HBF 还是 LPDDR 这些适配缓存推理场景的内存方案,其实都在快速地演进和碰撞中,并没有奠定类似于训练场景中“GPU + HBM”这种无可替代的选型方案。
对于内存厂商来讲其实是“过好日子”的阶段。因为需求是摆在那里,海量推理需求,哪怕成本或者性能提升个 10%,对于整个场景 TCO 优化将是成百上千倍放大。
当下 内存领域核心关键词是 快速变化、演进。
从过去这三年的趋势来看:
整体就是朝着更加务实和可落地的方向在演进。

上图总结了过去 3 年内存领域底层逻辑的抽象,核心想传递的和前面所阐述观点是一致的。


上图罗列了主力厂商在过去两年以及即将到来的 2026 年峰会上,发布的核心产品和技术演进路线图。对于关注厂商技术路线的同学来讲,可能会有些帮助。
延伸思考
这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~
如需获取文章中分析的原始材料,关注公众号、后台发送:FMS26-0703 免费获取原始表格和分析报告
#FMS26 #DRAM_HBM
---【本文完】---

丰子恺-护生画集- 无声的风谢 Color by GPT-image 2