首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >AI概念横空,企业数据准备好了吗?

AI概念横空,企业数据准备好了吗?

作者头像
数据存储前沿技术
发布2025-07-27 13:33:26
发布2025-07-27 13:33:26
1640
举报

全文概览

人工智能正以前所未有的速度重塑各行各业,但您是否意识到,驱动AI的强大计算能力,正被传统的数据基础设施所束缚?NVIDIA等巨头构建的全栈AI平台,对数据提出了近乎贪婪的需求,要求极高的数据传输速度和规模。然而,企业中昂贵的GPU集群却常常因数据供给不足而闲置,数据存储和基础设施已成为制约AI投资回报率的核心瓶颈。

您的企业是否也面临数据散落在不同存储系统、形成难以逾越的孤岛的困境?数据迁移的高昂成本和风险是否让您望而却步?在AI时代,如何才能有效连接传统数据资产与现代高性能计算需求,释放数据的真正价值?本文将深入探讨这一挑战,并为您揭示一种无需“推倒重来”,即可加速AI工作负载的有效策略。

阅读收获

  • 理解AI计算对现有数据基础设施带来的核心挑战。
  • 掌握应对企业数据孤岛和“数据重力”效应的有效策略。
  • 认识软件定义的数据经纬/全局数据平台在统一异构数据中的关键作用。
  • 了解如何根据自身需求和现有环境选择合适的AI数据平台解决方案。

人工智能时代的数据困境:统一传统与现代基础设施以加速工作负载

引言:人工智能计算与企业数据的共生关系

当前市场格局的形成,很大程度上源于 NVIDIA 成功构建了一个全栈式人工智能平台。该平台不仅涵盖了从图形处理器(GPU)硬件(如 Blackwell 和 Hopper 架构)到高速网络(如 InfiniBand)的物理层 1,更延伸至一个全面的软件生态系统——NVIDIA AI Enterprise 2。这一套件集成了用于开发和部署的各类软件、预训练模型、NVIDIA NIM(NVIDIA Inference Microservices)等微服务,以及 RAPIDS、Riva、NeMo Retriever 等一系列优化的库和工具 2。这种从硬件到软件的端到端解决方案,催生了对数据前所未有的、近乎贪婪的需求,要求数据传输具备极高的速度和庞大的规模。其直接后果是,企业中昂贵的 GPU 集群常常因数据供给不足而处于闲置状态,使得数据存储和基础设施成为制约人工智能投资回报率(ROI)的核心瓶颈 9。

为了应对这一挑战,战略联盟应运而生,成为市场的重要信号。NVIDIA 与日立(Hitachi)等传统企业级存储供应商的合作便是一个典型例证 11。这种合作远非简单的联合营销,而是一次深刻的技术协同。日立的虚拟存储平台 One(VSP One)提供了统一的块、文件和对象存储能力,正与 NVIDIA 的技术栈进行深度整合,旨在打造经过验证的“AI-Ready”基础设施解决方案 11。这一趋势证实了一个基本判断:计算和存储供应商必须协同合作,各取所长,方能为企业提供完整且高效的 AI 解决方案。NVIDIA 的平台战略已超越了单纯销售组件(如 GPU)的模式,转向提供一个完整的、端到端的解决方案,包括 DGX 系统、AI Enterprise 软件和 NIM 微服务 2。这种策略创造了强大的生态系统效应。通过提供全套计算和软件堆栈,NVIDIA 促使数据基础设施层必须进行适配与集成。这为那些能够与 NVIDIA 架构(例如,支持 GPUDirect Storage 技术)紧密结合的存储和数据管理公司创造了巨大的市场机遇。从本质上看,这种生态系统的构建对 NVIDIA 自身业务的扩展至关重要。为客户消除数据供给的复杂性,实际上是为其核心计算平台的销售扫清了障碍。因此,像日立这样的合作,以及对 WEKA、VAST Data、DDN 和 Hammerspace 等平台的认证,不仅对合作伙伴有利,更是 NVIDIA 扩大市场规模、缩短销售周期的关键举措 11。

本报告的核心论点是,对于大多数企业而言,解决 AI 数据瓶颈的最佳路径并非对现有存储系统进行全盘的“推倒重来”(rip-and-replace)。更有效、更经济的策略是部署一个软件定义的“中间件”或数据编排层。该层能够统一异构、分散的数据资产,使其无论物理位置如何,都能被 AI 工作负载高效访问,从而在保留现有投资的同时,架起一座连接传统基础设施与现代 AI 性能需求的桥梁。本报告将深入剖析这一方法,聚焦其架构原理,并对市场上的主流解决方案进行比较分析。

遗留系统的困境:在现有存储基础设施上运行 AI

在企业寻求利用人工智能时,其现有的存储基础设施往往成为一个严峻的挑战。传统存储架构与现代 AI 工作负载的需求之间存在着根本性的不匹配,这主要体现在以下几个方面。首先,传统的存储区域网络(SAN)主要为结构化数据和交易型工作负载设计,其架构无法有效应对 AI 所需的大规模并行处理和复杂的混合 I/O 模式 9。特别是传统的横向扩展 NAS,其以控制器(机头)为中心的设计,在面对成千上万个 GPU 核心发起的元数据密集型操作和高并发访问时,极易成为性能瓶颈 9。

其次,成熟企业面临的首要问题是数据孤岛化和碎片化。宝贵的训练数据被困在相互隔离的 NAS、SAN、对象存储和云存储桶中,格式各异且互不兼容 20。这种割裂状态使得 AI 模型无法获得一个全面、统一的数据视图,从而严重限制了其分析能力和最终效果。最后,“数据重力”(Data Gravity)效应进一步加剧了这一困境。企业积累的海量数据具有巨大的“惯性”,使得数据迁移变得成本高昂、耗时漫长且充满风险 25。迁移的成本不仅在于数据传输本身,更在于需要重写应用依赖、重新培训员工以及应对潜在的业务中断,这些因素共同构成了一个强大的阻力,使得大规模、一次性的数据迁移方案往往不切实际 26。

面对这一困境,企业站在了一个战略性的十字路口:是选择将数据全部迁移到一个为 AI 量身打造的全新存储平台,还是在现有基础设施之上进行“就地现代化”改造。后者通过在现有存储系统之上叠加一个数据编排平台来实现。这两种策略在成本、风险和价值实现速度上存在显著差异,需要进行审慎的权衡。

表 1: 数据现代化策略的战略比较

维度

全面迁移 (Full Migration)

就地现代化 (Modernize-in-Place)

前期成本

高。需要采购全新的硬件平台和软件。

中低。主要为软件许可费用,可利旧现有硬件。

运营中断

高。需要应用停机、复杂的数据割接和验证流程。

低。通过非中断的数据“同化”(Assimilation)技术,对现有业务影响极小 29。

AI 价值实现时间

长。必须等待数据迁移完成后,AI 项目才能全面展开和扩展。

短。AI 项目几乎可以立即开始使用被统一视图纳管的数据。

峰值性能

潜力极高。在专为 AI 设计的硬件上可达到理论上的最高性能。

高。性能受限于底层硬件,但通过并行访问等技术得到极大提升。

风险状况

高。面临迁移失败、数据丢失、项目延期和超出预算等风险。

低。现有系统保持完整,可采用渐进式、分阶段的部署模式。

管理复杂性

降低。最终统一到一个新的管理平台。

可能增加。需要管理一个新的软件层,但该层旨在抽象和简化底层复杂性。

现有资产浪费

高。大量旧有存储硬件被淘汰,造成投资浪费。

低。延长了现有硬件的生命周期,最大化其剩余价值。

架构之桥:数据经纬(Data Fabric)与编排中间件

为了解答企业如何连接传统数据孤岛与现代 AI 计算集群的疑问,理解“中间件”在其中扮演的角色至关重要。实际上,这个“中间件”并非单一产品,而是由功能互补的多个软件层构成的技术栈。

首先是 机器学习工作流编排(ML Workflow Orchestration) 工具。这类工具的核心功能是自动化机器学习的流程。它们如同一个乐团的指挥,负责协调从数据提取、预处理、特征工程到模型训练、验证、部署和监控的整个序列 31。这些工具通过定义、调度和监控有向无环图(DAG)来管理任务流,确保整个 MLOps 过程高效、可重复。市场上的主流代表包括 Apache Airflow、Kubeflow、Flyte 和 Prefect 等 33。

其次是 数据经纬/全局数据平台(Data Fabric / Global Data Platform)。这是一个架构,其核心价值在于提供一个统一的、逻辑化的数据视图,而无视数据物理上分散存储的现实。它自动化数据的管理移动,将底层的存储孤岛完全抽象掉 36。如果说工作流编排是“指挥”,那么数据经纬就是“通用翻译器”和“数据传送系统”。它通过创建一个全局统一的命名空间(Global Namespace),让任何授权的应用或用户都能像访问本地文件一样访问全域数据。Hammerspace 全局数据平台、Microsoft Fabric 和 IBM Data Fabric 都是此类解决方案的代表 36。

这两个层次协同工作,构成了现代 AI 数据栈的核心。工作流编排工具负责定义“做什么”和“何时做”,而数据经纬平台则负责确保执行任务时所需的数据能够“即时、高效地送达”。

全局数据平台的交互逻辑
全局数据平台的交互逻辑

全局数据平台的交互逻辑

这一架构成功的关键在于一个根本性的设计转变:数据平面(Data Plane)与控制平面(Control Plane)的分离。传统的 SAN/NAS 系统将文件系统(元数据)与物理磁盘(数据)紧密耦合在一个硬件设备中 9。这意味着访问数据必须通过特定供应商的控制器,而移动数据则依赖于主机端的拷贝进程。现代数据平台,如 Hammerspace,则将元数据从各个存储孤岛中“剥离”出来,汇集到一个独立于硬件的、全局的控制平面中 41。当一个客户端请求文件时,控制平面会告诉它:“你要的数据在戴尔的那个阵列上,具体地址是 XXX,请直接去取。” 数据的实际传输发生在客户端和存储设备之间,构成了数据平面。正是这种分离,才使得非中断的数据同化、跨不同厂商设备的自动分层以及统一命名空间的呈现成为可能,这也是“就地现代化”策略得以实现的技术基石。

市场洞察:数据聚合解决方案的比较分析

本节将深入探讨市场上的主流解决方案,以 Hammerspace 作为核心案例进行剖析,并将其与主要竞争对手进行结构化比较,旨在为企业在选择数据平台时提供清晰的决策依据。

A. 深度案例研究:Hammerspace 全局数据平台

Hammerspace 并非一个存储硬件,而是一个纯软件平台,其核心目标是创建一个“全局数据环境”(Global Data Environment)29。其架构的基石是将元数据(Metadata)与数据本身(Data)彻底解耦,从而构建一个跨越所有底层存储(无论厂商、无论地点)的、单一且权威的全局命名空间 41。

机制一:就地数据同化(Data-in-Place Assimilation)

这是 Hammerspace 应对遗留系统挑战的独特方案。它并非要求用户迁移数据,而是通过一个快速、非中断的扫描过程,将现有 NAS 或对象存储中的元数据“吸收”进来,而数据本身则保留在原位 29。在数分钟内,这些原本孤立的数据就会出现在全局命名空间中,并可通过标准的 NFS 或 SMB 协议被任何连接到 Hammerspace 的客户端访问。这一机制无需昂贵的迁移项目,即可迅速打破数据孤岛。

机制二:基于目标的编排(Objective-Based Orchestration)与元数据中心

Hammerspace 通过一种名为“目标”(Objectives)的策略来实现数据移动的自动化 44。管理员可以使用简单的、接近自然语言的规则来设定策略,例如:“确保‘项目X’中所有带有‘活跃’标签的文件,在伦敦的计算集群上都存在一个本地副本。” Hammerspace 的编排引擎会根据此目标,在后台自动、透明地完成数据同步,整个过程对用户和应用无感知 46。这一强大功能由一个丰富的元数据中心(Metadata Hub)驱动,它能够捕获标准文件属性、用户自定义标签,乃至嵌入在文件内部的特定元数据(如科研图像的参数),并以此作为自动化策略的触发条件 48。

机制三:通过超大规模 NAS(Hyperscale NAS)实现高性能访问

为了满足 GPU 集群对数据的高吞吐量需求,Hammerspace 采用了“超大规模 NAS”架构。这是一种基于行业标准并行 NFS(pNFS)构建的并行文件系统 22。与传统 NAS 不同,pNFS 将元数据请求与数据传输路径分离。客户端首先向元数据服务器查询文件位置,服务器返回一个包含该文件所有数据块所在存储节点位置的“地图”。随后,客户端可以直接与多个数据服务器建立并行的连接,同时拉取数据,从而极大地提升了整体吞吐率 10。

机制四:NVIDIA GPUDirect 与 Tier 0 存储

Hammerspace 已通过 NVIDIA GPUDirect Storage 认证 16。其关键优势在于,作为一个软件层,它能使任何底层存储(即使是本身不支持 RDMA 的传统 NAS)对 GPU 呈现为 GPUDirect-enabled 的数据源 16。其最具创新性的特性是“Tier 0”存储。该技术能够将 GPU 服务器内部通常闲置的本地 NVMe 硬盘整合到全局文件系统中。Hammerspace 利用这个超低延迟的存储层来执行检查点(checkpointing)等写密集型操作,能将 GPU 的等待时间从数分钟缩短至数秒。同时,它也用于预取训练数据,从而显著加速整个 AI 流水线 54。

B. 高性能数据平台的比较分析

Hammerspace 的核心理念是通过编排来统一异构环境,而市场上其他主要参与者——WEKA、VAST Data 和 DDN——则提供了不同但同样强大的解决方案。它们通常被视为数据迁移的目标平台,或是构建全新 AI 基础设施的基石。这种理念上的差异决定了它们各自的架构特点和最佳适用场景。

一个值得注意的市场趋势是,这些平台正在根据客户的技术成熟度和现有环境进行自然分化。选择哪种平台,不仅仅是性能指标的比较,更是对企业自身起点和战略目标的匹配。

  • 对于一个拥有数十年历史、数据散布在各类传统存储上的大型金融机构而言,其核心痛点是异构孤岛的统一。在这种情况下,进行“推倒重来”式的迁移几乎不可行。Hammerspace 的非中断同化与编排能力,使其成为解决此类问题的理想选择。
  • 对于一个资金充裕、从零开始构建大语言模型的 AI 初创公司而言,其环境是全新的(greenfield),核心诉求是极致的训练速度。他们很可能会选择构建一个专用的、性能最优的存储集群,WEKA 的架构在这种场景下极具吸引力。
  • 对于一个正努力应对多层存储(高性能闪存、混合存储、归档存储)带来的复杂性和高昂总拥有成本(TCO)的中型企业来说,其痛点在于架构复杂性和成本。VAST Data 提出的将多层存储整合为单一全闪存平台的愿景,恰好解决了这一难题。
  • 对于一个正在规划下一代百亿亿次(Exascale)超级计算机的国家级研究实验室,其关注的焦点是前所未有的规模和久经考验的可靠性。他们自然会倾向于选择 DDN 基于 Lustre 的解决方案,因为该方案在顶级超算领域拥有最悠久和最成功的部署记录。

因此,这些供应商在很多时候并非直接争夺同一笔交易。他们各自解决了 AI 数据挑战的不同侧面,其方案的选择取决于客户的既有资产、规模和首要目标。

表 2: 主流 AI 数据平台架构比较

维度

Hammerspace

WEKA

VAST Data

DDN

核心架构

软件定义的全局文件系统(在任何存储上进行数据编排)29

软件定义的并行文件系统 (NeuralMesh™) 17

解耦、共享一切的架构 (DASE) 55

基于硬件设备的并行文件系统 (EXAScaler/Lustre) 56

核心理念

统一并编排异构孤岛

极致性能与云原生敏捷性

将所有层级整合至单一闪存平台

久经考验的百亿亿次级 HPC 性能与可靠性

遗留数据处理

就地同化(非中断集成)42

分层/迁移(将数据移至 WEKA 平台,可分层到 S3)57

整合(旨在替代传统存储层)59

迁移(将数据移至 EXAScaler 平台)60

数据访问协议

NFS, SMB, pNFS, S3 61

POSIX, NFS, SMB, S3 57

NFS, SMB, S3, SQL-aware 62

Lustre 客户端, NFS, SMB 63

NVIDIA GPUDirect 集成

已认证。可使任何底层存储支持 GPUDirect。创新的 "Tier 0" 本地 NVMe 利用技术 16。

已认证。与 DGX SuperPOD/BasePOD 深度集成。通过内核旁路(kernel bypass)实现超低延迟 58。

已认证。支持 NFS-over-RDMA,与 DGX 生态系统深度集成 18。

已认证。通过 Lustre 客户端深度集成。"Hot Nodes" 技术支持本地缓存 19。

关键差异化

无需迁移即可统一现有的、多厂商的存储,形成单一命名空间。

在处理大小混合文件时提供极致的低延迟性能;云原生灵活性强。

革命性的全 QLC 闪存性价比;统一的文件、对象和数据库访问能力。

在全球最大的超级计算环境中拥有无可匹敌的领导地位;在百亿亿次级别上技术成熟。

理想用例

拥有大量异构存储投资,希望在不中断业务的情况下启用 AI 的复杂企业环境。

性能至上的 AI/ML 训练、基因组学等场景,以及需要绝对文件性能的云优先型组织。

寻求简化整体数据架构、将多层存储整合到单一可扩展全闪存平台以降低 TCO 的企业。

国家实验室、政府机构和需要成熟、稳健的并行文件系统性能的大规模科研机构。

结论与战略建议

本报告的分析表明,NVIDIA 所引领的强大 AI 计算能力的普及,已将企业 IT 基础设施的瓶颈从计算端彻底转移到了数据端。为了应对这一挑战,一类新型的、以软件为核心的数据平台应运而生。一个清晰的趋势是,行业的价值正在从存储硬件本身,迁移到能够跨越复杂、混合、多厂商环境,实现数据统一、智能编排和访问加速的软件层。

与其宣告某个单一的“赢家”,本报告为企业架构师和决策者提供一个务实的、分步走的战略框架,以应对 AI 时代的挑战:

  1. 评估数据版图与“数据重力”:首要步骤是全面盘点企业的数据资产。它们位于何处?价值几何?迁移的难度和成本有多大?这一评估将直接揭示“就地现代化”(如 Hammerspace 方案)与“迁移整合”(如 VAST、WEKA、DDN 方案)两种策略中,哪一种更符合企业现实 20。
  2. 剖析 AI 工作负载:深入分析 AI 流水线的具体 I/O 特征。工作负载是以大型顺序读取(数据引入)、小型随机读写(模型检查点),还是混合模式为主?不同的平台在应对不同 I/O 模式时各有优劣 69。例如,Hammerspace 的 Tier 0 存储专为加速检查点操作而设计 54,而 WEKA 则以其在处理混合大小文件时的高性能著称 57。
  3. 将架构与需求匹配:结合前两步的评估结果以及表 2 中的比较分析,选择与企业核心目标最匹配的架构。
    • 若首要目标是在不中断业务的前提下,统一复杂的遗留环境,Hammerspace 的架构提供了最直接的解决方案。
    • 若首要目标是在新建项目中追求极致的性能,WEKA 是顶级的竞争者。
    • 若首要目标是长期的 TCO 优化和架构简化,VAST Data 的整合模型极具吸引力。
    • 若首要目标是为超大规模 HPC 环境寻求久经考验的可靠性,DDN 则是公认的领导者。

总而言之,企业级基础设施的未来是以数据为中心,而非以存储为中心。数据平台的战略选择,已成为决定一个组织在 AI 时代创新能力和竞争力的基石。投资于一个灵活的、软件定义的、将数据与底层硬件解耦的数据战略,是构建一个能够从容应对未来挑战的 AI-Ready 企业的关键一步。

===

参考资料

  1. NVIDIA AI Enterprise, accessed July 12, 2025, https://resources.nvidia.com/en-us-product-overview/nvidia-ai-enterprise-8
  2. NVIDIA AI Enterprise, accessed July 12, 2025, https://docs.nvidia.com/ai-enterprise/index.html
  3. NVIDIA AI Enterprise | Cloud-native Software Platform, accessed July 12, 2025, https://www.nvidia.com/en-us/data-center/products/ai-enterprise/
  4. NVIDIA NIM for Developers, accessed July 12, 2025, https://developer.nvidia.com/nim
  5. NVIDIA NIM, accessed July 12, 2025, https://docs.nvidia.com/nim/index.html
  6. Riva Speech AI SDK - Get Started - NVIDIA Developer, accessed July 12, 2025, https://developer.nvidia.com/riva
  7. NVIDIA NeMo Retriever - NVIDIA Developer, accessed July 12, 2025, https://developer.nvidia.com/nemo-retriever
  8. RAPIDS Suite of AI Libraries - NVIDIA Developer, accessed July 12, 2025, https://developer.nvidia.com/rapids
  9. How legacy storage infrastructure could endanger your future - Blocks and Files, accessed July 12, 2025, https://blocksandfiles.com/2025/01/29/how-legacy-storage-infrastructure-could-endanger-your-future/
  10. An Inside Look at Hammerspace's HPC-Grade Architecture - theCUBE Research, accessed July 12, 2025, https://thecuberesearch.com/an-inside-look-at-hammerspaces-hpc-grade-architecture/
  11. Hitachi Accelerates AI-Driven Transformation for Physical and Industrial Applications, accessed July 12, 2025, https://www.hitachi.com/New/cnews/month/2025/03/250319.html
  12. Hitachi Collaborates with NVIDIA to Accelerate Digital Transformation with Generative AI, accessed July 12, 2025, https://www.hitachi.com/New/cnews/month/2024/03/240319.html
  13. Virtual Storage Platform One (VSP One) - Hitachi Vantara Federal, accessed July 12, 2025, https://www.hitachivantarafederal.com/what-we-do/products/data-storage/vsp-one/
  14. Introducing Virtual Storage Platform (VSP) One: One Solution for Government Data Infrastructures - Hitachi Vantara Federal, accessed July 12, 2025, https://www.hitachivantarafederal.com/resources-insights/virtual-storage-platform-one-solution-profile/
  15. AI Software Suite for Enterprise IT - NVIDIA, accessed July 12, 2025, https://www.nvidia.com/en-in/data-center/products/ai-enterprise-suite/
  16. NVIDIA - Hammerspace, accessed July 12, 2025, https://hammerspace.com/hs-partners/technology-partners/nvidia/
  17. Accelerate AI with NeuralMesh™: An Adaptive Storage System Built for AI - WEKA, accessed July 12, 2025, https://www.weka.io/
  18. High-Performance AI Data Platform for AI at Scale - VAST Data, accessed July 12, 2025, https://www.vastdata.com/technology/nvidia
  19. DDN on files, objects and AI training and inference - Blocks and Files, accessed July 12, 2025, https://blocksandfiles.com/2025/02/24/ddn-thinking-on-files-objects-and-ai-training-and-inference/
  20. AI Integration into Legacy Systems: Challenges and Strategies - Optimum, accessed July 12, 2025, https://optimumcs.com/insights/ai-integration-into-legacy-systems-challenges-and-strategies/
  21. Data Storage Solutions | NAS, SAN and DAS | Proactive, accessed July 12, 2025, https://proactive.co.in/solution/data-center/storage
  22. Hammerspace Unveils the Fastest File System in the World for Training Enterprise AI Models at Scale, accessed July 12, 2025, https://hammerspace.com/hammerspace-introduces-high-performance-nas/
  23. The AI Revolution Has a File Problem — And Your Current Storage Can't Solve It - Nasuni, accessed July 12, 2025, https://www.nasuni.com/blog/the-ai-revolution-has-a-file-problem-and-your-current-storage-cant-solve-it/
  24. Enterprise AI and Legacy Systems: A Double-Edged Sword on the Path to Modernization, accessed July 12, 2025, https://medium.com/snowflake/enterprise-ai-and-legacy-systems-a-double-edged-sword-on-the-path-to-modernization-9f54e1da1fab
  25. On-Premises vs. Cloud for AI Workloads - Redapt, accessed July 12, 2025, https://www.redapt.com/blog/on-premises-vs-cloud-for-ai-workloads
  26. How AI Simplifies and Guards Data Migration | Built In, accessed July 12, 2025, https://builtin.com/articles/ai-assisted-data-migration
  27. Automated Data Migration: The Future of Data Transfer - Functionize, accessed July 12, 2025, https://www.functionize.com/ai-agents-automation/automated-data-migration
  28. Data Conversion vs Data Migration: Key Differences - Shinydocs, accessed July 12, 2025, https://shinydocs.com/blog-home/blog/data-conversion-vs-data-migration-key-differences/
  29. Global Data Platform - Hammerspace, accessed July 12, 2025, https://hammerspace.com/software/
  30. Hammerspace Software: Building a Global Data Environment, accessed July 12, 2025, https://www.titandatasolutions.com/ae/wp-content/uploads/sites/2/2022/10/Hammerspace-Data-Sheet-Oct-2022-v2.1.pdf
  31. What is Machine Learning Orchestration | Giskard, accessed July 12, 2025, https://www.giskard.ai/glossary/machine-learning-orchestration
  32. Best Machine Learning Workflow and Pipeline Orchestration Tools - Neptune.ai, accessed July 12, 2025, https://neptune.ai/blog/best-workflow-and-pipeline-orchestration-tools
  33. Top 17 Data Orchestration Tools for 2025: Ultimate Review - lakeFS, accessed July 12, 2025, https://lakefs.io/blog/data-orchestration-tools-2023/
  34. Build production-grade data and ML workflows, hassle-free with Flyte, accessed July 12, 2025, https://flyte.org/
  35. The 6 Best ML Orchestration Tools for Developers - DuploCloud, accessed July 12, 2025, https://duplocloud.com/blog/ml-orchestration/
  36. What is Microsoft Fabric - Microsoft Fabric - Learn Microsoft, accessed July 12, 2025, https://learn.microsoft.com/en-us/fabric/fundamentals/microsoft-fabric-overview
  37. Data Fabric Solutions - IBM, accessed July 12, 2025, https://www.ibm.com/solutions/data-fabric
  38. Workflow Data Fabric - ServiceNow, accessed July 12, 2025, https://www.servicenow.com/now-platform/workflow-data-fabric.html
  39. Category: White Paper - Hammerspace, accessed July 12, 2025, https://hammerspace.com/category/white-paper/
  40. Hammerspace Global Data Platform - dve advanced systems GmbH, accessed July 12, 2025, https://dveas.de/wp-content/uploads/2024/06/02-White-Paper-Global-Data-Platform_v1b-compressed_1.pdf
  41. Hammerspace Global Data Environment, accessed July 12, 2025, https://4911315.fs1.hubspotusercontent-na1.net/hubfs/4911315/HS%20Site%202022%20Downloads/HS%20Whitepaper%202022%20-%20Final.pdf
  42. Simplifying Data Management With Hammerspace - Insights From Analytics, accessed July 12, 2025, https://www.insightsfromanalytics.com/post/simplifying-data-management-with-hammerspace
  43. How To Create a Global Namespace With Hammerspace - Medium, accessed July 12, 2025, https://medium.com/@hammerspace/how-to-create-a-global-namespace-with-hammerspace-a40618de4d45
  44. Automating Data Management With Metadata - YouTube, accessed July 12, 2025, https://m.youtube.com/watch?v=2ev4Nk5WBUA&pp=ygUOI3N1cGVybWV0YWRhdGE%3D
  45. Data Orchestration Services - Hammerspace, accessed July 12, 2025, https://hammerspace.com/data-orchestration/
  46. How the Power of Metadata can Automate Data Management - Hammerspace, accessed July 12, 2025, https://hammerspace.com/how-the-power-of-metadata-can-automate-data-management/
  47. Feed Your Models Faster: Optimizing AI Training Pipelines with Smart Data Storage Orchestration - Hammerspace, accessed July 12, 2025, https://hammerspace.com/feed-your-models-faster-optimizing-ai-training-pipelines-with-smart-data-storage-orchestration/
  48. MetadataHub - Hammerspace, accessed July 12, 2025, https://hammerspace.com/hs-partners/technology-partners/metadatahub/
  49. Hammerspace challenges object storage norms for AI - Blocks and Files, accessed July 12, 2025, https://blocksandfiles.com/2025/02/07/hammerspace-file-vs-object-ai-training/
  50. Category: Technical Brief - Hammerspace, accessed July 12, 2025, https://hammerspace.com/category/technical-brief/
  51. Hyperscale NAS For Dummies - Hammerspace, accessed July 12, 2025, https://hammerspace.com/hyperscale-nas-for-dummies/
  52. Hammerspace Hyperscale NAS Achieves GPUDIRECT Storage Self-Certification from NVIDIA, accessed July 12, 2025, https://hammerspace.com/hammerspace-hyperscale-nas-achieves-gpudirect-storage-self-certification-from-nvidia/
  53. GPUDirect Demystified: Why Your File System is Crucial for Maximum GPU Throughput & Efficient AI Data Storage - Hammerspace, accessed July 12, 2025, https://hammerspace.com/gpudirect-demystified-why-your-file-system-is-crucial-for-maximum-gpu-throughput-efficient-ai-data-storage/
  54. Hammerspace boosts GPU server performance with latest update - Blocks and Files, accessed July 12, 2025, https://blocksandfiles.com/2024/11/14/hammerspace-opens-up-fast-local-gpu-server-nvme-storage-to-speed-ai-training/
  55. Meet VAST Data's DASE Architecture, accessed July 12, 2025, https://www.vastdata.com/platform/how-it-works
  56. EXAScaler Product Family, accessed July 12, 2025, https://www.aspsys.com/wp-content/uploads/2022/01/ddn-exa-data-sheet.pdf
  57. WEKA Data Platform for Generative AI, accessed July 12, 2025, https://www.weka.io/solutions/weka-for-generative-ai/
  58. WEKA Data Platform for NVIDIA DGX BasePOD with H100 Systems, accessed July 12, 2025, https://www.weka.io/wp-content/uploads/files/resources/2024/01/weka-basepod-certification-sb.pdf
  59. Rethinking Data Architecture: VAST Data's Performance, Simplicity & Flexibility, accessed July 12, 2025, https://www.vastdata.com/blog/rethinking-modern-data-architectures
  60. Simplify AI Data Management with DDN EXAscaler Hot Pools, accessed July 12, 2025, https://www.ddn.com/blog/optimized-ai-data-management-using-ddn-exascaler-hot-pools/
  61. Hammerspace Advances GPU Data Orchestration Capabilities, accessed July 12, 2025, https://www.dbta.com/Editorial/News-Flashes/Hammerspace-Advances-GPU-Data-Orchestration-Capabilities-164541.aspx
  62. All-Flash Data Storage for Artificial Intelligence - VAST Data, accessed July 12, 2025, https://www.vastdata.com/usecase/artificial-intelligence
  63. DDN Powers Google Cloud Managed Lustre for AI and HPC Workloads - HPCwire, accessed July 12, 2025, https://www.hpcwire.com/off-the-wire/ddn-powers-google-cloud-managed-lustre-for-ai-and-hpc-workloads/
  64. EXAScaler Cloud - DDN - Microsoft Azure Marketplace, accessed July 12, 2025, https://azuremarketplace.microsoft.com/en-us/marketplace/apps/ddn-whamcloud-5345716.exascaler_cloud_app?tab=overview
  65. High-Performance Storage For NVIDIA Cloud Partners - WEKA, accessed July 12, 2025, https://www.weka.io/wp-content/uploads/files/resources/2024/09/weka-ncp-reference-architecture.pdf
  66. High-Performance Storage for NVIDIA Cloud Partners - WEKA, accessed July 12, 2025, https://www.weka.io/resources/reference-architecture/high-performance-storage-for-nvidia-cloud-partners/
  67. Spotlight: NVIDIA BlueField DPUs Power the VAST Data Platform for AI Workload Optimization, accessed July 12, 2025, https://developer.nvidia.com/blog/spotlight-nvidia-bluefield-dpus-power-the-vast-data-platform-for-ai-workload-optimization/
  68. NVIDIA/gds-nvidia-fs: NVIDIA GPUDirect Storage Driver - GitHub, accessed July 12, 2025, https://github.com/NVIDIA/gds-nvidia-fs
  69. Eli5 - Vast vs Weka, HPC & Deep Learning - Reddit, accessed July 12, 2025, https://www.reddit.com/r/HPC/comments/18mwvgq/eli5_vast_vs_weka_hpc_deep_learning/

延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  1. 除了文中提到的技术,您认为未来还有哪些新兴技术或架构模式能进一步优化AI时代的数据流动和管理?
  2. 在实际部署数据平台时,企业除了考虑技术性能,还应重点关注哪些非技术因素(如组织结构、人才储备、供应商生态等)?
  3. 数据平面与控制平面的分离是现代数据平台的核心,这一设计理念还能在企业数据架构的哪些方面带来创新?

Notice:Human's prompt, Datasets by Gemini-2.5

#AI与数据平台 #DataFabric

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 人工智能时代的数据困境:统一传统与现代基础设施以加速工作负载
    • 引言:人工智能计算与企业数据的共生关系
    • 遗留系统的困境:在现有存储基础设施上运行 AI
    • 架构之桥:数据经纬(Data Fabric)与编排中间件
    • 市场洞察:数据聚合解决方案的比较分析
      • A. 深度案例研究:Hammerspace 全局数据平台
      • B. 高性能数据平台的比较分析
    • 结论与战略建议
    • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档