全文概览
人工智能的快速发展正在深刻改变存储行业的格局。随着大模型的广泛应用和AI技术的不断进步,数据量呈指数级增长,对高容量、高性能存储的需求也日益迫切。
QLC(四层单元)技术作为NAND闪存的最新突破,以其高密度和低成本特性,成为满足这一需求的理想选择。然而,QLC技术也面临耐用性差、编程难度大等挑战。为了充分发挥QLC的潜力,灵活数据放置(FDP)技术应运而生,通过优化数据布局,显著提升了SSD的性能和寿命。本文通过案例研究,深入探讨了FDP在QLC SSD中的实际应用效果,以及如何结合多租户QoS管理技术进一步提升存储系统的性能。这些技术的结合,不仅为AI时代的存储需求提供了完美解决方案,也为未来存储技术的发展指明了方向。
1. 人工智能推动高容量存储增长
- AI驱动的存储市场预计到2033年将达到2000亿美元以上,年复合增长率(CAGR)超过20%。
- 企业领域和SSD将成为AI存储市场的主导力量。
- 高容量SSD的需求迅速增长。
2. QLC技术在大容量SSD中的价值
- QLC优势:高密度、高容量、低成本。
- QLC劣势:编程难度大、耐用性差、P/E周期少。
- QLC非常适合AI时代的高容量SSD应用。
3. FDP技术的优势
- FDP允许主机提供数据放置提示,优化数据布局。
- FDP的优势:减少写放大(WAF)、减少垃圾回收(GC)、改善写入性能、提升耐用性。
- FDP对QLC NAND SSD特别有益。
4. QLC SSD与FDP的案例研究
- 测试配置:Silicon Motion 16TB企业级SSD,Micron N48R QLC NAND,U.2接口。
- 测试结果:FDP显著降低写放大因子(WAF),提升写入吞吐量。
- FDP启用时,写入带宽稳定在2.5GB/s,而非FDP情况下仅为500MB/s。
5. 多租户服务质量(QoS)提升技术
- PerformaShape™技术基于“双状态漏桶”算法,提升多租户环境下的QoS。
- PerformaShape™的优势:平滑波动、隔离噪声邻居、充分利用SSD带宽。
阅读收获
- 了解QLC技术在AI存储中的优势与挑战。
- 掌握FDP技术如何优化QLC SSD的性能和寿命。
- 学习FDP在实际测试中的应用效果及其对存储系统的提升。
- 了解多租户环境下QoS管理技术(如PerformaShape™)的应用价值。
人工智能推动高容量存储增长
- 预计到2033年,人工智能驱动的存储市场将达到2000亿美元以上,年复合增长率(CAGR)为20%以上。
- 企业领域和固态硬盘(SSD)预计将主导人工智能驱动的存储市场。
- 高容量SSD的需求迅速增长。
Note
在鹏弟看来,数据智慧本质是暴力求解的过程,基于海量计算洞察现象背后千丝万缕的联系。
现阶段基础大模型广泛落地,意味着这层规律可以基于计算范式的抽象保留下来,从对话过渡到生产,领域模型对专有数据的抽象,必将促进过程数据的持久化,从而推动存储需求。
QLC 在大容量SSD领域的价值
QLC 是最新的 NAND 技术
- QLC 优势
- 更高的 NAND 芯片密度
- 更高的 SSD 容量
- 每 GB 更低的成本
- QLC 劣势
- 编程难度较大
- 耐用性较差(DWPD)
- 每擦写/编程周期较少(P/E cycle)
- QLC 非常适合 AI 时代高容量 SSD 应用
- 为了延长 QLC NAND 的使用寿命,可以使用像 FDP 和 ZNS 这样的高级数据布局技术
数据放置的价值
- FDP允许主机提供数据放置的提示
- 在主机的提示下,数据可以被放置在不同区域,以便隔离
- FDP的优势
- 减少写放大(WAF)
- 减少垃圾回收(GC)
- 改善写入性能
- 改善耐用性
- FDP对所有类型的NAND都有好处,特别适合QLC NAND SSD
Cite
在 SSD写放大与数据放置技术:从原理到实践一文中,文末介绍了数据灵活放置当前的应用生态,涉及到文件系统、系统库(Cachelib、CSAL)等多个维度不同的优化方法。
QLC SSD与FDP案例研究
测试配置:
- SSD硬件:Silicon Motion 16TB 企业级SSD,采用Micron N48R QLC NAND,U.2接口形式
- SSD固件:启用FDP,8个RUH和8个命名空间 vs 禁用FDP,8个命名空间
- 测试平台:ASUS PRIME Z690-P(I5-12500,16GB)
- 测试程序:FIO
- 测试工作负载:8个FDP顺序写任务,与8个非FDP顺序写任务进行对比
FDP在QLC SSD中的测试结果
- 测试结果: 显示了FDP(灵活数据放置)在QLC SSD中的优势。
- 启用FDP时,写入吞吐量保持更稳定,相比于非FDP,性能更佳。
- 非FDP情况下,吞吐量出现波动和下降,显示出数据管理上的不稳定。
- FDP处理下的写放大因子(WAF)明显低于非FDP处理下的WAF。
- 通过FDP,可以有效地减少写放大的波动,降低系统的写入负担。
- WAF(写放大因子)FDP与非FDP对比:
- 写入吞吐量(Write THP)FDP与非FDP对比:
Note
FDP写入带宽能稳定在2.5GB/s,而 Non-FDP 带宽只有500MB/s(比HDDs 强不到哪去!),可见写放大对有效带宽的影响还是非常明显的。
多租户服务质量(QoS)提升技术
- 为了进一步提升在多租户环境下的QLC SSD QoS,可以将QoS管理技术与FDP结合使用。
- PerformaShape™ 作为一种QoS管理示例,基于“双状态漏桶”(Dual State Leaky Bucket)算法开发,其中每个QoS集都分配了两个令牌桶,并且在令牌可用时流量才会被允许通过。
PerformaShape™的优势:
- 平滑波动
- 隔离噪声较大的邻居(“噪声”指的是某些任务或应用的写入频率过高,影响其他任务的性能)
- 完全利用SSD带宽
Cite
更多关于 PerformaShape™ 技术的报道可阅读以下历史文章:
- SiliconMotion:多租户SSD的PerformaShape™算法
- 主要内容
- 介绍了云存储SSD中多用户性能问题的挑战,特别是如何保障租户应用程序的服务质量(QoS)。
- 详细描述了PerformaShape™算法的工作原理,该算法基于双状态令牌桶算法,通过为每个QoS集合分配令牌桶来控制IO请求的速率和优先级。
- 讨论了双状态令牌桶算法的两个阶段:SPS(Set Per Service)和DPS(Device Per Service),分别用于平滑IO请求和限制设备带宽的过度预订。
- 通过模拟测试展示了PerformaShape™算法的效果,包括隔离噪声邻居、限制IO请求速率和提高整体性能等。
- SMI:虚拟化环境下NVMe SSD性能优化
- 主要内容
- 介绍了在多虚拟环境中如何通过PerformaShape技术优化NVMe SSD的I/O性能。
- 描述了实验配置,包括硬件、软件及测试平台,并通过FIO测试程序和特定工作负载展示了PerformaShape技术的效果。
- 讨论了PerformaShape技术的优势,包括平滑性能波动、隔离噪声邻居和充分利用SSD带宽。
- 提供了详细的测试数据和对比,展示了使用PerformaShape技术前后的性能差异,强调了其在多租户环境中的应用价值。
- 人工智能革命通过对高容量SSD的需求改变了存储行业
- QLC SSD最适合高容量应用,但也存在局限性
- FDP(灵活数据放置)有助于QLC SSD的推广
- 通过减少写放大因子(WAF)和垃圾回收(GC)来延长QLC NAND的寿命。
- 提升写入性能。
- PerformaShape™技术进一步提高了多租户环境中的QoS
- 通过FDP和PerformaShape™技术启用的高容量QLC AI SSD是AI存储应用的完美解决方案
Note
鹏弟看来:本文属实是SMI 借 PerformaShape™ 技术 蹭 FDP话题了,因该技术主要是实现多租户访问SSD带宽 QoS 的,场景主要是虚拟化应用,FDP 数据放置软件层要控制读写带宽的话,完全可以基于更轻量化的技术来实现,而不是借 PerformaShape™ 来控制流量。
延伸思考这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~
- FDP技术在QLC SSD中的应用是否具有更广泛的适用性?它能否推广到其他类型的存储介质?
- QLC技术在AI存储中的潜力是否还有待进一步挖掘?未来可能有哪些创新应用?
- 在多租户环境下,除了PerformaShape™技术,还有哪些方法可以提升SSD的QoS?这些方法的优缺点是什么?
原文标题:FDP Benefits in QLC SSD: A Case Study