首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >FMS 2026前瞻-2:HBM光环褪去,内存务实转身

FMS 2026前瞻-2:HBM光环褪去,内存务实转身

作者头像
数据存储前沿技术
发布2026-07-03 20:22:13
发布2026-07-03 20:22:13
00
举报

阅读收获

  • 把握3D DRAM、LPDDR6、MRDIMM、HBF四条技术路线的成熟度与落地节奏,为产品规划提供参考坐标
  • 理解"HBM成本墙"对存储产业链估值逻辑的重塑——HBM高利润叙事正在让位于"推理内存缺口"的量价新平衡
  • 混合内存管理策略首次作为独立技术方向进入产业讨论,冷热数据分层调度与新型存储单元的协同设计,是值得关注的交叉研究课题

全文概览

过去两年,HBM(高带宽内存)伴随GPU训练集群的爆发式增长,一度被视为存储行业的"皇冠明珠"。SK海力士、三星等巨头纷纷将产能向HBM倾斜,资本市场也对这条赛道给予了极高溢价。然而,当AI的重心从训练转向推理,一个尖锐的问题浮出水面:HBM的高成本,能否支撑大规模推理部署?

2026年FMS(闪存峰会)给出了行业的集体回应。本届峰会上,DRAM与HBM相关的15场路演传递出一个清晰信号:HBM不再是唯一答案。3D DRAM无电容方案将刷新时间从64ms提升至2900ms,LPDDR从移动端向数据中心渗透,MRDIMM在有限插槽上实现内存扩展,HBF(高带宽闪存)作为低成本替代方案进入讨论——这些技术方向共同指向一个更务实的内存架构未来。

本文基于FMS 2026公开日程与演讲材料,梳理DRAM与HBM领域的技术趋势,并结合2024-2026三年峰会的横向对比,试图回答:内存行业的下一站,究竟在哪里?

👉 划线高亮 观点批注


FMS 26 DRAM&HBM 日程

上表 是 FMS26 中与 DRAM 和 HBM 相关路演的日程安排

纵向列了日期、时间、子分类、演讲标题,以及演讲者和机构

总结来看,FMS26 关于DRAM的讨论聚焦在 第二天和 第三天,其中DRAM 的内容都计划在 Day2, 而 HBM 都在 Day3,分别是 11场和 4场

共计 72 个上下游厂商参展。

  1. 内存领域: (a) DRAM 领域:依然由传统存储巨头领衔。 (b) HBM 领域:除了 SK hynix、三星之外,还有一些新的初创公司(如 ScaleFlux、Rambus),以及像谷歌 DeepMind 等研究机构,在 HBM 领域都提出了一些新的观点。
  2. 内存验证与设计领域: Cadence 作为该领域的核心,其 EDA 模拟工具在 FMS 上主导分享了 3 场内存相关的技术话题,成为验证领域最活跃的厂商。

DRAM 领域的11场的路演分析中细化了 5 个子主题,分别是:

  1. 3D DRAM
  2. LPDDR 低功耗内存
  3. MRDIMM 多通道 DRAM 设计
  4. AI 内存的需求分析(由 IBM 带来)
  5. 内存验证与信号完整性的分析(由 Cadence 主导,共两场)

展开来看,在 3D DRAM 领域: 在 26 年的技术峰会中,一个核心的主题是以无电容 DRAM 的创新,将 DRAM 的刷新时间从 64ms 提升到 2900ms。这意味着 DRAM 从原始的高频刷新保证数据驻留的操作上,升级到可以大幅度降低刷新次数,从而减少功耗。这些都是无电容这种新兴半导体设计带来的技术优势。

最近读到国内的内存巨头(CX)发表了一篇新论文,讲到从 1T-1C 当前成熟工艺制程上,如何去扩展 DRAM 的内存容量。提出了纵向堆叠的技术方案,试图通过封装技术的创新,来延长 DRAM 在 2D 领域的技术寿命。反观 2026 年 FMS 话题集中度,主要是一些未来创新型 3D DRAM 的技术探讨。

在低功耗 DDR(LPDDR)领域主要技术趋势是,厂商开始考虑使用 LPDDR 来进行KVCache卸载。关于 KVCache 卸载在 2026 年其实有很多讨论,有说用 SSD 来做的,也有说用 CXL 扩展内存池来做。在 2026 年峰会上提出用 LPDDR 来做,三者底层脉络是:成本会逐渐增加,但是性能也会得到更高保障。LPDDR 原来是低功耗领域的移动端内存,目前的趋势是越来越受到数据中心场景关注。

第三个是 MRDIMM 多路内存设计,成为在有限服务器插槽上实现内存扩展的核心路径。

在 HBM 子主题下,一共有 4 场分析。核心讨论的话题是 HBM 成本分析及其替代方案。

在当下内存海量需求背景下,行业已经意识到,内存厂商把产能都压注在 HBM 上,其实是与市场需求背离的:

  1. 尽管 HBM 的利润可能会比 DDR 更高,且在训练场景中 HBM 是不可或缺的;
  2. 但目前的市场需求显示,推理场景已经呈现出明显的内存缺口。

因此,如果仍然把产能压注在 HBM 上,就会与整个行业需求产生矛盾。

这也是为什么在今年峰会上,大部分厂商都在讨论如何在应用场景中实现 HBM 成本压降以及替代方案。峰会中提出了“HBM Cost Wall”,HBM 作为GPU的核心成本单元, HBM 的成本正成为 AI 推理规模化的瓶颈。这标志着 HBM 进入了大规模采用前的“成本焦虑期”,促使行业内对更大容量、更低成本方案的讨论。这就包括紧邻的 HBF(高带宽闪存)技术讨论中传递出的信号:HBM 不再是唯一的答案,混合内存策略和 HBF 替代方案正在进入产业的讨论。

我觉得这在内存整个大话题下是一以贯之的。不管是在 DRAM 领域讨论的 3D DRAM,还是 LPDDR 从移动端到数据中心端的转型,本质上都是要以更高的性能,同时以合理的成本去解决或缓解数据中心数据传递过程中的带宽和容量问题。

行业已经充分意识到 HBM 成本是不可持续的。这也是 2026 年与 2024、2025 年行业内观点的差异。

前两年,行业内对 HBM 的景气度其实是非常期待的。作为一个新兴的内存领域,随着 GPU 场景的拓展,很多人都在讨论如何扩展 HBM 的产能和应用。但在 2026 年,整个行业内传递出更加清醒的认知。这也预示着 HBM 未来可能会有更加聚焦的高价值场景。

上表总结了 本次峰会传递出的 DRAM & HBM 领域技术趋势 。 洞察的角度和核心观点在前面也所有论述。

上表 总结了内存领域本次峰会传递出的新技术方向及未来几年的路线图,一共包括 6 个方向:3D DRAM、HBM4、LPDDR6、MRDIMM、HBF 以及混合内存的管理方案。

纵向罗列了未来几年这些技术在成熟过程中的里程碑事件,以及发展中存在的一些关键变量:

  1. 3D DRAM 电容替代方案。如果良率低、成本高,在规模化落地时面临的挑战还是比较大的。
  2. HBM4 核心问题是如何提高 TSV 堆叠层数,以及堆叠层数增加所带来的散热问题。
  3. MRDIMM 作为多通道内存标准,过去两年已有服务器或 CPU 厂商去兼容和适配。需要 CPU 底层通信原理上支持多通道。
  4. HBF 其设计理念是使用闪存单元来替代内存。HBF 方案的容量会急速地增加,但随着数据持久化所带来的延迟和工程优化,可能会带来其他成本,散热同样是HBF 需要克服的问题
  5. 混合内存策略 这是在峰会中首次被作为一个全新的技术方向来讨论的。

关于数据领域的分层设计和-调度优化,其实过去几十年来一直有不同的技术方案讨论,从最早的 NUMA 到多级缓存,再到冷热数据区分,这些都是为了识别计算过程中数据访问的冷热程度,而优化出的内存管理方案。随着 LPDDR 以及 HBF 这些新的存储单元出现,如何设计一套混合的内存管理策略,可能是业界做好统一管理越来越显性化的需求。

FMS 24-26 横向比较

上图总结了 24-26 三年 围绕内存领域的技术话题讨论

给我的感触是,内存领域的技术创新随着 GPU 加速计算的范式做快速的适配和转型。

英伟达 GPU + HBM,这一套顶级性能的架构目前来看在训练场景已经奠定了话语权;但是随着从训练转向推理,低成本、大容量的内存方案成为目前业界共同攻坚的领域。

这一块还是处于比较早期的。无论是 HBF 还是 LPDDR 这些适配缓存推理场景的内存方案,其实都在快速地演进和碰撞中,并没有奠定类似于训练场景中“GPU + HBM”这种无可替代的选型方案。

对于内存厂商来讲其实是“过好日子”的阶段。因为需求是摆在那里,海量推理需求,哪怕成本或者性能提升个 10%,对于整个场景 TCO 优化将是成百上千倍放大。

当下 内存领域核心关键词是 快速变化、演进。

从过去这三年的趋势来看:

  1. 2024 年: 讨论的是如何基于 2D 微缩去探索更大 DRAM 的集成方案,当时也讨论到了一些 3D 的堆叠方案。
  2. 2025 年: 行业内的核心关注点从 DDR 和 HBM 这两大核心元素上,转移到了 GDDR 和 LPDDR 的一些行业应用。因为在 2025 年可能已经意识到,HBM 的高成本以及在产能上的局限性,已经限制它没有办法在短期快速去满足推理的需求,所以目光又从 HBM 转移到 DDR 本身的产能提高和性能优化上。
  3. 2026 年: (a) 3D DRAM 取得重大突破:提出了基于 3D 5 电容的方案,去优化 DDR 的功耗,从而实现 3D 纵向的可堆叠。 (b) HBM 成本瓶颈显现:显性地提出了 HBM 在推理场景中,其高昂的成本是方案落地的一个瓶颈点。 (c) 务实方案展开讨论:同时展开了更多关于 LPDDR6 的实践、HBF(高带宽闪存)以及混合内存管理方案的讨论。

整体就是朝着更加务实和可落地的方向在演进。

上图总结了过去 3 年内存领域底层逻辑的抽象,核心想传递的和前面所阐述观点是一致的。

上图罗列了主力厂商在过去两年以及即将到来的 2026 年峰会上,发布的核心产品和技术演进路线图。对于关注厂商技术路线的同学来讲,可能会有些帮助。


延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  1. HBF(高带宽闪存)以闪存单元替代DRAM单元,容量大幅提升但延迟增加。在推理场景中,延迟敏感度与成本敏感度的平衡点在哪里?HBF是否可能在某些推理负载中完全替代HBM?
  2. 混合内存管理策略被首次作为独立技术方向提出,但过去NUMA、多级缓存等方案始终未能统一内存管理。这一次,LPDDR + HBM + HBF + DDR的多层内存架构,是否真的能催生可落地的统一调度方案?技术瓶颈在硬件还是软件?
  3. 3D DRAM的无电容方案将刷新时间从64ms提升到2900ms,但良率和成本仍是规模化瓶颈。如果3D DRAM在2028年前无法达到成本拐点,推理内存缺口将由哪条技术路线填补?

如需获取文章中分析的原始材料,关注公众号、后台发送:FMS26-0703 免费获取原始表格和分析报告

#FMS26 #DRAM_HBM

---【本文完】---

丰子恺-护生画集- 无声的风谢 Color by GPT-image 2

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-07-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • FMS 26 DRAM&HBM 日程
  • FMS 24-26 横向比较
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档