不是实验室跑分,中国存储靠什么拿下全球双榜第一
中国经济导报、中国发展网 记者崔立勇报道
6月24日,德国汉堡,ISC 2026高性能计算大会发布最新IO500榜单。中科曙光(603019)ParaStor F9000分布式全闪存储系统,在生产型全节点和10节点两个榜单中同时位列第一。这是中国厂商首次在IO500生产型榜单中实现双榜登顶。
在此之前,能在同一届IO500生产型榜单中同时拿下全节点和10节点第一的,只有少数几家美国厂商。
这不是曙光第一次出现在IO500榜单上。2022年,曙光ParaStor分布式存储曾拿下10节点榜单第一。四年时间从单一榜单突破到双榜登顶,中科曙光北京公司副总裁何振的判断是:“这次的意义不只是‘拿了一个冠军’,而是国产高端存储第一次在全球最严格的真实生产型评测体系中形成了系统性领先。”在他看来,同时覆盖10节点与全节点并取得第一,说明ParaStor F9000“已经不是单点技术突破,而是具备了支撑大规模AI与高端计算生产系统的工程化能力”。
何振对记者表示,曙光存储过去更多是“对标国际先进”,而现在是在真实AI基础设施体系中开始参与甚至在部分关键维度形成领先,“这种领先不是某一个指标的领先,而是系统级能力、长期稳定性和规模化支撑能力的综合体现”。
生产型榜单含金量在哪里?
IO500是高性能计算与人工智能领域权威的存储系统性能基准测试榜单。其中“生产型榜单”仅纳入已在真实生产环境中长期运行的存储系统,要求满足实际业务负载、冗余设计与持续运行能力,部署周期通常以年计。与实验室环境下的极限优化不同,生产型榜单更接近一场“生产系统能力审计”,重点考察长期稳定性、复杂混合负载能力和规模扩展一致性三个维度。
中科曙光北京公司总裁助理、分布式存储产品部总经理石静解释:“生产系统要求存储系统真正在实际做应用,并且运行时间要超过一年,不超过一年也不能参选。”根据榜单信息,ParaStor F9000在实测中带宽性能最高提升超247%,元数据性能最高提升超126%(全节点),将世界纪录最高提升超171%(10节点)。
存储系统在计算体系中的位置正在发生根本性变化。过去,算力是主角,存储是配角。但在大模型训练进入万卡乃至十万卡规模后,GPU算力增长速度远高于数据供给能力,瓶颈逐渐从“算力不足”转向“数据无法持续供给”。何振说,存储是整个AI计算基础设施中数据流动的“主动脉”。
自国家超算互联网核心节点启动建设以来,ParaStor F9000已投入实际生产环境,目前已在数万卡集群中稳定运行超过一年。随着国家超算互联网核心节点建成6万卡规模超智融合集群,该系统已支持了百余个AI、高性能计算领域的生产应用。
中科曙光分布式存储总工程师袁清波表示,曙光存储系统经过20多年发展,在数据通路的认知上积累了很多经验。几年前,公司按照对存储系统的理解重新定制了硬件系统,也就是ParaStor F9000。“它给我们提供了两倍的PCIe lane数量,这是最基础的基础,有了以后才有了后边更大的性能提升。”
在行业应用中,这些能力已经得到验证。在具身智能领域,中科曙光为智元机器人提供基于ParaStor分布式全闪存储的专属存储解决方案,支撑通用型具身智能机器人的快速迭代,提供超过500GB/s聚合读带宽。在自动驾驶领域,中科曙光连续为国内头部造车新势力提供超百PB存储资源,支撑每日TB级路采数据的实时接入与高效存储,覆盖从“数据采集—清洗标注—模型训练—仿真验证”的全流程数据闭环,将模型研发周期缩短40%以上。在科学计算领域,该系统联合龙讯旷腾MatPL软件,依托scaleX万卡超集群,完成414.7亿原子规模液态水分子动力学模拟计算,刷新世界纪录。产业统计显示,中科曙光AI存储已连续两年位列中国市场份额首位。
存储角色的转变,在技术架构上体现得更为清晰。袁清波提到了中科曙光的“AI存储三级协同”——以存提算、以存代算、以存降本。“以存提算”是通过存储侧的数据路径优化与智能编排,让GPU不再等待数据;“以存代算”是把部分轻量数据处理下沉到存储侧完成,减少计算链路中的无效搬运;“以存降本”是通过数据分层与资源协同,在保证性能的同时减少高成本资源占用。石静认为,存储系统正在从传统的“容量型基础设施”向“面向AI工作流的数据引擎”演进。
如果破解存储行业“涨价”的压力?
当前存储行业正经历近15年来最陡峭的涨价周期。AI算力需求爆发后,存储、网络、算力同步扩张带来系统性成本上升。何振认为,客户面临的核心矛盾已经不是“买不买存储”,而是“如何用同样的预算支撑更大的算力和数据规模”。
ParaStor F9000通过“智能数据分层”可降低TCO达40%。何振解释,这个“降本”的逻辑是通过系统效率提升,把原本需要线性扩展的硬件投入转化为更高密度、更高利用率的系统能力输出。具体来说,一是通过数据热度分级与调度优化,把高频访问数据放在更高性能路径上,把低频数据沉淀到更高性价比介质;二是在系统层面通过架构优化提升单节点有效带宽与IOPS能力,减少硬件堆叠。
从产业路径来看,何振认为这种“以技术换效率、以效率降成本”的方式,正逐渐成为国产存储的一个重要差异化方向。在AI基础设施进入规模化阶段后,单纯拼硬件规模和价格空间已经越来越有限,真正的竞争点正在转向系统级优化能力。
袁清波补充,ParaStor F9000在硬件与软件层面均实现全栈自主研发,使得存储系统可以在协议栈、数据路径、调度机制等多个层面进行深度协同优化。此前,曙光集中式全闪存储FlashNexus亦在SPC-1国际性能测试中取得全球第一。
高速互联网络在AI基础设施中的作用越来越关键。“要想富先修路”,中科曙光高速网络互联产品部总工程师万伟分析,“高速互连对于集群系统,类似高铁这种交通基础设施对于城市发展一样。即使计算芯片有再高的算力,存储有再高的存力,如果高速互连的能力不足,也无法发挥出它们的最大性能。”他认为,下一代AI基础设施的竞争将围绕高速互联展开。
在智算中心建设中,“算力强、存力弱、网络不均衡”的问题普遍存在。何振认为,这本质上是资源规划方式没有适配大模型时代的数据流动特征。在超算互联网节点的实践中,优化重点不只是单点性能,而是“存算网协同下的数据流效率”。他提出,未来智算中心建设需要从“资源堆规模”转向“系统设计优先”,以应用负载建模为基础去设计存算配比。
市场空间来自存量还是增量?
高端全闪存储长期是技术壁垒较高的领域。ParaStor F9000的突破,是否意味着国产存储已经从“可用”进入到“可规模化支撑关键系统”的阶段?石静的回答是肯定的。她认为,这一阶段的核心标志,不再是单点性能指标,而是能否在超大规模智能计算与高端计算系统中长期稳定运行,并支撑持续增长的复杂业务负载。
过去国内政企关键行业的高端存储长期依赖海外品牌。现在国产存储实现性能全球第一,客户在关键基础设施选型上有了更多选择。石静指出,客户关注的已经不只是“是否国产”,而是考虑三个核心因素:系统在真实生产环境中的稳定性验证,对AI负载的适配能力,整体TCO与长期运维效率。替换存储体系是一个逐步迁移、验证和重构的过程,节奏正在加快。存量市场空间依然可观,但更重要的是增量市场——AI驱动的新型算力基础设施正在成为主战场。“未来竞争的核心不在于‘替换多少存量’,而在于‘能否在新一代AI基础设施中成为默认选项’。”
在全国一体化算力网络建设中,存力已经成为算力瓶颈。何振认为,存储不再是局部资源,而是跨区域数据流转的核心枢纽。中科曙光的策略是把存储能力嵌入算力基础设施体系中,通过存算网协同架构,让数据能够在不同算力节点之间高效流动。在这一过程中,存力的市场空间不会简单线性增长,而是与AI算力利用率提升强相关。从中长期看,存储市场的天花板将由“数据规模”转向“算力效率”,存储不再只是容量市场,而是算力系统效率市场的一部分。
从全球市场看,高端存储长期由少数国际厂商主导,但这一格局正在被AI驱动的基础设施重构所改变。何振观察到,市场关注点正在从“品牌与生态惯性”逐步转向“真实负载下的系统效率与TCO”。
对于未来3—5年全球高端存储市场的变化,何振的判断是,AI驱动成为主导需求,系统级优化能力取代单点硬件性能,存算网协同能力成为核心竞争维度。中科曙光的核心壁垒不只在存储产品本身,而在于系统级工程能力,包括大规模集群落地经验、存算网协同架构设计能力,以及在真实生产环境中长期验证的能力体系。“竞争已经从‘存储产品竞争’,升级为‘AI基础设施系统能力竞争’。”
从2022年的十节点冠军到2026年的ISC 2026双榜登顶,四年时间,中科曙光完成了从存储架构、介质、协议栈到软件调优的全面重构。石静用八个字概括了中科曙光存储获得此次成绩的原因:“行稳致远,长期主义”。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com