全文概览
文档深入探讨QLC技术在数据中心存储系统中的应用及其带来的优势和挑战。随着数据量爆炸性增长,传统存储解决方案已无法满足日益增长的数据需求。QLC(四层单元)作为新兴的技术,因其高密度和低成本而成为解决这一问题的潜在方案。
文档首先介绍了当前数据增长的趋势及面临的挑战,并概述了不同工作负载类型对存储系统的要求。随后,通过对比分析,说明了QLC技术相对于传统TLC技术在成本效益方面的优势。进一步详细讨论了QLC技术的选择和部署策略,包括考虑工作负载的特性、数据访问模式以及性能和耐久性的要求。此外,还介绍了Solidigm公司的QLC产品线,展示了它们如何针对不同的应用场景提供了优化的解决方案,从而提高存储系统的效率和可持续性。通过案例研究和TCO(总拥有成本)计算,强调了采用高密度QLC存储技术可以显著降低数据中心的整体运营成本,并对环境友好。
总体而言,文档全面地探讨了QLC技术在数据中心存储领域的应用前景,为读者提供了关于如何选择和实施QLC技术以应对未来数据存储挑战的深刻见解。
数据海量增长趋势
- 存储需求在快速增长,2025 年预计将达到 181 ZB,受到未结构化数据、云化、可持续性和边缘计算等因素推动。
- 数据生成速度惊人,全球每天数百万用户通过社交媒体、流媒体、电子商务和支付系统产生海量数据。每分钟,用户观看数万小时的视频、发送数百万封邮件、完成数十亿美元的交易,这进一步凸显了数据存储密度和效率的重要性。
Cite
数据来源:https://www.domo.com/learn/infographic/data-never-sleeps-11
存储领域面临的挑战
- 存储需求和挑战随着技术的发展,存储需求从集中化数据中心逐步扩展到边缘基础设施和设备层面,导致了设备尺寸、能耗、维护难度、效率和可靠性上的显著差异。
- 趋势边缘设备和基础设施因其低功耗和灵活性成为发展重点,但在服务性、可靠性和运营效率上仍需优化。
- 意义未来的存储技术需要在集中化和分布式之间找到平衡,以满足不断增长的数据需求,同时降低能耗并提高可持续性。
QLC 在行业的落地实践
- QLC 闪存的使用增长QLC(四层单元存储)正在被广泛采用,用于提升存储性能、容量和效率,同时降低成本。
- 重要厂商的案例
- DellQLC 技术大幅降低了存储成本,支持从 11 个驱动器扩展至 5.9 PB。
- VAST Data通过 Solidigm SSDs 改进存储能力,帮助企业更高效地处理存储需求。
- NetApp强调 QLC 在 AI 工作负载中的性能和扩展性。
- DDN展示了 QLC 在支持 Nvidia SuperPODs 中的卓越性能和能耗效率。
- 趋势与意义QLC 存储正在成为未来高效、可扩展存储解决方案的核心,特别是在 AI 和数据密集型领域的应用场景中。
QLC 应用需要克服数据模式和块大小问题
- QLC 的适配场景:
- QLC 在读密集型工作负载中表现最佳,特别是在大块、顺序读取的条件下。
- 在混合读写或写密集型工作负载中,QLC 的性能逐步下降,但仍然可以在某些区域提供可接受的性能。
- 优化建议:
- 选择 QLC 存储时,需考虑容量需求、数据模式、工作负载特性以及性能要求。
- 根据图表提供的块大小、数据模式和读写比例,找到适配的区域以优化性能。
- 实际意义:
- 通过理解 QLC 的特性,可以有效地平衡存储性能与成本,在大数据和 AI 应用场景中最大化其使用价值。
QLC+ZNS 的落地实践,可参考以下文章:
Reference
灵活的 IUs 配置项
- QLC 存储设备的优化选项:
- D5-P5430 使用 4KB 的 IU,是一种简单的 TLC 替代方案,适合直接部署和替换。
- D5-P5336 使用 16KB 的 IU,提供了更灵活的写入选项(≥16KB 写入或非对齐写入),并通过写入整形优化性能和耐久性。
- 关键区别:
- D5-P5430 更适合直接部署且易于替换现有 TLC。
- D5-P5336 在采用灵活性和性能优化方面更具优势,适合复杂写入需求的场景。
- 意义:
- 通过不同的 IU 配置,可以在不同应用场景中平衡存储性能、成本和耐久性。这种灵活性使得 QLC 存储技术更容易被广泛采用。
间接单元(IUs)在大容量存储的优化,可参考阅读:
Reference
工作负载分析——QLC 的适用领域
- 基于企业的工作负载:
- QLC 适合 高性能计算 (HPC)、通用用途、数据库 和 决策支持系统 (DSS) 等场景,通常要求较大的块大小和较低的队列深度。
- 云计算 工作负载中需要使用 写入整形 来优化 QLC 的性能。
- 基于云的工作负载:
- 内容交付网络 (CDN) 和 社交媒体 适合使用 QLC,因为这些场景中存在高读比例和较大的块大小。
- 电商 和 服务器存储 工作负载中,随机写入需要通过写入整形来提高性能。
- AI 特定工作负载:
- 对于 数据摄取 和 训练,QLC 的性能较低,不适合这些应用。
- 检查点 和 推理 工作负载适合 QLC,特别是块大小为 32-128KB 的场景。
- 数据湖 场景可以使用混合解决方案,例如 SLC 缓存 + QLC,来实现性能优化。
- 结论:
- 通过根据工作负载模式选择合适的 QLC 配置,可以优化性能、容量和耐久性。
- 不同型号(如 D5-P5430 和 D5-P5336)提供灵活的选项,以适应各种企业和云工作负载需求。
Note
这张图片还是非常有价值的,对于长期关注某一场景的工作人员来说,很难建立对全场景的存储理解。图片区分企业、云和AI 三种大场景,基于此细化出不同子场景,给出子场景的读写IO比例,从而推荐块大小配置,并给出对应的QLC 产品推荐。
耐久性-应用场景匹配
关键指标:
- PBW耐久性表示,写入总量以 PB(拍字节)为单位。
- DWPD每日写入次数(Drive Writes Per Day),假设工作负载为 100% 随机写入。
总结
- 高耐久性写入任务:
- D7-P5810 适合需要极高写入密度的工作负载,如缓存、AI 训练和 HPC。
- D7-P5620 / PS1030 是写入密集型任务的理想选择,如高频交易、云计算和小块高工作周期的 OLTP。
- 混合与主流场景:
- D7-P5520 / PE1010 针对混合读写任务,如 AI 数据摄取、数据库管理和电商等。
- 读密集型任务:
- D5-P5430 提供更低耐久性但适合读密集型工作负载的设备,例如 OLAP、服务器存储和 VDI。
- 容量优化型任务:
- D5-P5336 专注于低写入需求的高容量场景,如内容交付网络 (CDN)、AI 数据管道和对象存储。
Note
上一张图是基于业务场景/性能 来定义QLC产品选型,这一张图是匹配 QLC使用寿命和应用场景的对应关系,进一步回应 大容量存储需要在性能和使用寿命间取得平衡 的核心命题。
QLC 应用的TCO 价值
- 输入与输出关系:
- 数据中心的成本优化需要基于多种输入因素(如存储成本、能效、容量利用率等),这些因素影响关键输出指标(如年度总成本、驱动器和服务器需求、能耗成本等)。
- 决策重点:
- 在选择 QLC 存储解决方案时,必须通过综合分析输入和输出参数,优化系统性能和成本。
- 尤其需要关注 每瓦特存储容量 (TB/W) 和 年度总拥有成本 (TCO),以提高能效并降低长期开支。
- 实际意义:
- 数据中心在采用 QLC 技术时,需要全面评估价格、工作周期、容量利用率等输入因素,确保在功耗、设备配置和总成本之间取得平衡。
QLC 替换 HDD 场景预演
- 空间优化:
- 使用 Solidigm D5-P5336 存储解决方案可以将机架数量从 7 个减少到 1 个,显著节省物理空间。
- 这种高密度设计非常适合空间受限的高效数据中心。
- 能源优化:
- D5-P5336 的能源成本较 HDD 系统降低 74%,显著减少了年度运营成本(从 84,000 美元降低到 22,000 美元)。
- 这一改进不仅节省成本,还能降低碳足迹,提升数据中心的可持续性。
- 适用场景:
- 此解决方案尤其适用于需要高容量、高密度存储的对象存储任务(如云存储、数据湖等)。
- 意义:
- 通过采用更高密度的存储设备(如 Solidigm D5-P5336),企业可以实现显著的成本节约和可持续性改进,同时满足现代数据中心的高效运营需求。
上述空间节约和能源成本的计算依据。
QLC 产品目录
- 型号特点:
- D5-P5316主要针对读密集型工作负载,适用于需要高容量和高耐久性的应用场景。
最大容量:30.72 TB。
最大耐久性:顺序 128KB IO 可达 105 PBW。
- D5-P5430适合主流应用以及读密集型场景。
提供从小容量 (3.84 TB) 到高容量 (30.72 TB) 的选择。
具有更高的随机 IO 耐久性,随机 4KB IO 可达 32 PBW。
- D5-P5336专注于优化容量的读为中心应用,支持更大的单盘容量 (最高 61.44 TB)。
在顺序工作负载下具有极高的耐久性 (顺序 128KB IO 可达 213 PBW)。
- 外形规格 (Form Factors):
- 提供多种规格以适应不同的硬件需求,包括 U.2、E1.L 和 E3.S,覆盖标准和紧凑型存储设备。
- 容量范围:
- 覆盖 3.84 TB 到 61.44 TB 的广泛范围,适合从中小型数据需求到超大容量存储需求。
- 耐久性表现:
- 随机和顺序 IO 下的耐久性指标各异,需根据工作负载类型选择合适的型号。
小结
- D5-P5316适用于高容量需求的读密集型任务,如对象存储、数据湖等。
- D5-P5430提供主流存储解决方案,支持多种容量选择,适合混合型工作负载。
- D5-P5336专为容量优化的读为中心场景设计,如内容交付网络 (CDN) 和冷存储。
总结
- 核心问题:
- 存储系统需要更高效的解决方案来应对现代数据中心和高性能计算环境的挑战,包括吞吐量、密度和能效的平衡。
- 优化需求:
- 存储性能优化不仅关乎数据量,还需要提升计算单元(XPU)的利用率,并最大化服务器的总体拥有成本(TCO)效益。
- QLC 的选择性:
- QLC 存储的适用性因场景而异,用户需根据具体应用需求选择适配的 QLC 型号。
Note
Solidigm 作为聚焦 QLC 大容量存储的厂商,最近几年一直在推动QLC落地,从FMS公布的材料来看,其市场思路非常清晰,几篇PR材料中的数据意识非常强烈,尽管有些数据需要在具体场景下才能得出最终结论,但厂商能基于行业常识,抽象出一般结论,这对于新产品的快速推广非常有帮助。
更多关于Solidigm的产品,可阅读以下文章: