这也是深信服 AI 统一存储要解决的核心问题:企业建设 AI 基础设施时,不能只看 GPU 数量和模型平台,也要看数据能否持续、稳定、高效地送到计算侧。AI 算力真正转化为模型迭代效率,前提是底层数据供给链路不掉队。存储如果仍然停留在“容量资源”的角色,就很容易在 GPU 数据加载、小文件处理、跨系统搬运、Checkpoint 写入和知识数据治理中成为新的瓶颈。
因此,AI 时代的企业存储需要从资源池升级为数据底座。深信服 AI 统一存储的价值,不是把传统存储参数换成 AI 话术,而是通过高性能数据访问、多协议互通、异构纳管、统一视图、数据版本控制和向量桶等能力,把 AI 数据从“存下来”推进到“供得上、流得动、管得住、可复用”。
AI 工作流改变了存储的技术要求
AI 工作流的第一个变化,是数据形态发生了变化。过去企业核心数据多是结构化业务数据或普通文件,而 AI 场景中更常见的是图片、视频、语音、文本、传感器数据、标注文件、特征文件和模型文件。这些数据既有大文件连续吞吐,也有海量小文件随机访问;既有训练热数据,也有长期保存的历史数据;既要被算法团队高频读取,也要被 IT 团队统一治理。
AI 工作流的第二个变化,是数据访问路径变长。一个自动驾驶样本可能先从采集端进入对象存储,再被解压、切片、清洗和标注,随后进入训练平台读取,训练完成后还要归档并参与下一轮数据筛选。一个企业 RAG 知识库也不是简单上传文档,而是涉及原文保存、切片、向量化、元数据关联、权限继承、版本更新和生命周期管理。数据在多系统之间移动得越频繁,存储就越容易从后台资源变成前台瓶颈。
AI 工作流的第三个变化,是算力成本放大了数据等待成本。GPU 集群投入越高,数据加载慢、目录扫描慢、协议转换慢、数据重复拷贝带来的浪费就越明显。客户感知到的并不一定是“存储不够快”这个抽象问题,而是训练启动慢、GPU 利用率不稳定、数据准备周期长、模型迭代节奏被拖慢。
深信服 AI 统一存储把数据供给链路作为核心能力来设计
在训练侧,深信服 AI 统一存储首先解决的是数据供给问题。AI 训练并不是只需要单一大带宽,大模型训练需要持续吞吐,多模态训练需要高并发小文件访问,Checkpoint 和中间结果需要稳定写入,GPU 数据加载链路还需要减少 CPU 和传统协议栈带来的额外开销。深信服 AI 统一存储通过单节点 120GB/s 读带宽、40GB/s 写带宽、小文件单节点 40 万 IOPS、100 微秒级小文件写入低时延、多活元数据服务架构和 RDMA 高速通道,支撑训练数据更稳定地进入计算侧。
这些指标背后的技术逻辑,比单纯跑分更重要。海量小文件训练中,性能瓶颈往往不是单个文件读不快,而是 open、stat、create、setattr、目录遍历等元数据操作在高并发下被放大。深信服 AI 统一存储通过多活 MDS、目录分片和元数据缓存能力,降低单点元数据服务压力,使图像训练、标注文件访问、自动驾驶样本处理和工业视觉数据集读取具备更好的并发基础。
在 GPU 数据路径上,深信服 AI 统一存储通过 GDS、NFS over RDMA、pNFS/NFS+ 和 RDMA 高速通道,减少传统数据搬运路径中的额外开销。对客户而言,这类能力的意义不是协议名称本身,而是让存储、网络和计算之间形成更顺畅的数据供给链路,降低 GPU 等数据的概率。AI 训练效率不是由某个单点能力决定,而是由存储介质、元数据服务、协议栈、网络链路和训练框架共同决定。
多协议互通让 AI 数据不再被系统边界切碎
企业 AI 数据通常不会只存在一种协议环境中。Windows 标注团队可能使用 SMB,Linux 训练任务可能使用 NFS,数据湖和平台工具可能使用 S3,容器平台还需要通过 CSI 或文件协议挂载数据。如果每一种协议都对应一份独立数据,AI 流程就会被复制、转换和人工搬运拖慢。
深信服 AI 统一存储通过 NFS、SMB、S3 等标准协议以及协议互通能力,让同一份数据能够被不同业务环节按需访问。目录桶能力进一步融合文件系统层级目录结构与对象存储扁平架构,使对象存储既保留 S3 生态优势,又更适合 AI 数据集按目录组织和批量访问。对企业而言,这意味着标注、训练、对象数据湖和知识应用可以围绕同一套数据底座协同,而不是在多个资源池之间来回搬运。
面向对象访问链路,深信服 AI 统一存储通过 S3 over RDMA 和 NVIDIA cuObject,进一步强化对象存储进入 AI 热路径的能力。传统对象存储适合海量数据承载,但在 AI 训练热路径中常受协议栈、内核路径和 CPU 数据搬运影响。S3 over RDMA 的价值在于优化对象访问数据面,cuObject 的价值在于让对象数据更好服务 GPU 数据加载。二者结合,使对象存储不再只是训练前后的容量池,而可以成为 AI 数据供给链路的一部分。
统一视图、数据版本和向量桶让 AI 数据进入治理阶段
当 AI 项目从试点进入规模化,数据治理会成为新的关键问题。训练数据集需要版本管理,模型效果需要追溯到对应数据版本;RAG/Agent 需要管理原始文档、向量、元数据、权限和生命周期;企业已有 NAS、对象存储和云存储也需要先被发现、被检索、被纳管,再决定哪些数据进入高性能层,哪些数据长期归档。
深信服 AI 统一存储的数据统一视图能力,支持跨异构物理存储设备、桶与目录的逻辑聚合,并基于统一视图进行多维度元数据检索。它的意义不是做一个新的管理界面,而是帮助企业建立 AI 数据资产地图:数据在哪里,属于哪个项目,处于什么阶段,访问热度如何,是否需要流动到高性能层。对于已有多套 NAS、对象存储和云存储的企业,这种“先统一视图、再按需流动”的路径,比一开始就大规模迁移更现实。
深信服 AI 统一存储的数据版本控制,则把训练数据集从普通文件目录提升为可追溯的数据资产。基于数据强一致性的 Git 式版本管理能力支持分支、Commit、Merge 和秒级回滚,使算法团队能够清楚记录每次训练对应的数据版本。当模型效果发生变化时,团队可以更明确地区分问题来自代码、参数、样本、标注还是数据清洗结果。
在 RAG/Agent 场景中,深信服 AI 统一存储的向量桶提供原始非结构化数据与高维向量特征数据的同源存储能力,并支持统一生命周期管理和联合查询。企业知识数据不能只看向量检索,还要看原文是否可保留、向量是否能与原文关联、元数据是否可管理、权限和版本是否可持续治理。深信服 AI 统一存储把原文、向量、元数据和生命周期放在同一数据底座中,支撑企业知识数据长期运营。
企业最终需要的是可持续的 AI 数据底座
对算法团队来说,深信服 AI 统一存储减少的是数据等待、重复拷贝和实验复现成本。对 AI 平台团队来说,深信服 AI 统一存储提供的是跨协议、跨集群、跨数据阶段的数据协同能力。对 IT 团队来说,深信服 AI 统一存储能够把已有 NAS、对象存储、云存储和高性能训练层纳入统一流动体系,降低多套系统割裂造成的运维复杂度。
对管理层来说,AI 存储的价值不应只体现在单点性能参数上,而应体现在 GPU 投入、数据资产沉淀和长期 TCO 控制之间的闭环。深信服 AI 统一存储通过冷热数据流动和异构纳管,让热数据进入高性能层,让温冷数据进入更合适的容量层或已有存储资源,让数据按照访问热度和业务价值流动,而不是长期堆在同一种介质上。
AI 时代,企业存储正在从“容量资源”升级为“数据底座”。深信服 AI 统一存储的技术价值,正是在数据承载、数据加速、数据流动和数据治理之间形成组合能力:训练侧支撑 GPU 数据供给,数据工程侧减少协议割裂和重复搬运,知识应用侧承载原文、向量和元数据治理,IT 侧实现统一视图与生命周期管理。这样的存储,才更接近企业 AI 规模化落地所需要的基础设施。



