意在松动寡头格局?阿里突然发力高端CPU,盯上AI Agent这一波机会
阿里巴巴再放大招。
3月24日,在玄铁RISC-V生态大会上,阿里巴巴达摩院发布新一代旗舰CPU玄铁C950,以及两款RISC-V原生AI计算引擎——Vector加速引擎与Matrix加速引擎。
从参数看,玄铁C950已触及当前RISC-V高性能天花板。在SPECint2006基准测试中,其单核通用性能首次突破70,刷新RISC-V处理器纪录。
值得注意的是,玄铁C950与AI计算引擎的协同设计。两款RISC-V原生AI计算引擎与玄铁CPU统一编址,将通用高性能算力与AI算力融合,流畅运行Qwen3-235B-A22B、DeepSeek V3-671B。阿里巴巴达摩院认为,这是CPU首次原生支持千亿参数大模型,有望成为AI Agent时代的新型服务器CPU样本。
RISC-V是一种开源、模块化且可扩展的精简指令集架构,允许自由使用、修改和定制,适用于从嵌入式系统到高性能计算的广泛应用场景。相较于以复杂指令集著称的x86,以及强调能效比的ARM,RISC-V凭借开源、模块化设计及零授权费,成为新兴可定制化解决方案。AI Agent时代,RISC-V架构迎来新的发展窗口。
“RISC-V诞生十五年来走出了一条高速发展之路,正从备选迅速走向主流。”中国工程院院士倪光南在大会现场表示,RISC-V已正式占据全球处理器市场的25%份额,x86和ARM两分天下的格局正在终结,芯片设计进入全球共享资源的新阶段。
据行业分析机构SHD Group预计,到2031年,RISC-V设备出货量将激增至360亿颗,保持31.7%的年复合增长率,市场规模将超3000亿美元。
高端CPU需求上升
“AI正迈向一个转折点,”英伟达创始人、首席执行官黄仁勋近期表示,随着智能变得具有能动性,能够推理并采取行动,重心就转移到了编排这些工作的系统。CPU不再只是支持模型,而是开始驱动模型。
对计算架构的需求正在被重塑,这一变化已在硬件形态上有所体现。在前不久的GTC大会上,英伟达发布了全新的Vera CPU机架,集成了256个液冷Vera CPU,能够持续支持超过22500个并发的CPU环境,每个环境均可以全性能独立运行。
另一侧,Arm也在调整自身路径。3月25日,Arm宣布推出首款自研处理器Arm AGI CPU,基于Neoverse平台,面向数据中心AI推理场景。这也是Arm成立35年来,首次从“IP授权”走向“自研芯片”,某种程度上反映出AI基础设施竞争的重心,正从GPU转向整机能力。
与早期依赖GPU进行大规模并行计算的模型不同,Agentic AI不仅负责内容生成,还需通过检索增强生成(RAG)、调用外部API完成复杂任务,这类负载天然更依赖CPU在控制流与系统调度上的能力。
阿里巴巴达摩院的判断进一步印证这一趋势。“随着AI迈向Agentic AI阶段,很多任务处理又重新回到CPU上。”阿里巴巴达摩院首席科学家孟建熠表示,“现在需要更强算力的CPU、更大容量的内存、更好的I/O,GPU也需要在CPU配合下做得更加高效,所以从系统的角度我们需要协同创新、开放、有生态的架构来支撑起未来Agentic AI所带来的新世界。”
基于这一判断,达摩院将玄铁C950与Matrix、Vector两款AI计算引擎整合,尝试在单芯片内运行千亿大模型。据悉,该芯片在千问30B模型上推理速度约80Token/s,在235B模型上约34Token/s,在DeepSeek671B满血模型上约18Token/s。
从产业侧看,RISC-V创新成果也在加速涌现。在大会现场,清微智能、全志科技(300458)、瑞芯微(603893)、北京智芯微、宏思电子、南芯科技、物奇微、特普斯微等厂商展示了相关应用,包括AI眼镜、电力工控、Wi-Fi网络、电源管理、数据安全、物联网及服务器等场景。芯翼信息科技CEO肖建宏表示,RISC-V正随着芯片产业的发展和客户的需求不断在变化。
对于技术路径,达摩院将“可扩展性”视为关键变量。
“可扩展性是RISC-V CPU在AI时代的制胜法宝,”孟建熠表示,“我们提供功能稳定、兼容性好的高性能基础CPU产品,支撑客户面向自有场景进行扩展,通过软硬件深度协同探索RISC-V能力上限。”
生态体系尚待成熟
“在走向生态繁荣的路上,RISC-V需要迎接通用计算和AI计算两场攻坚战。”孟建熠表示。虽然RISC-V广泛渗透进智能终端、汽车、家电、通信等领域,但长期存在性能不足和软件生态壁垒。只有推出高性能标杆产品,RISC-V才能真正把握AI时代机遇,与传统架构同台竞技,打开更广阔的应用市场。
生态补强首先体现在开源社区的推进。达摩院与中国科学院软件研究所等联合发起如意社区,共同优化AI和高性能通用计算软件栈,内核开源贡献率排名第一;携手openKylin打造RISC-V原生AI操作系统,支持OpenClaw部署;与中兴通讯合作推进服务器领域的开源组件优化,软硬件协同扩展指令加速可将EC性能提升4倍、CRC性能提升3.5倍。
全志科技产品研发中心总经理黄少锐表示,当前RISC-V的软件生态已发生明显变化,从内核、中间件到AI部署,整体成熟度接近“开箱可用”。对企业而言,低成本构建新产品的门槛正在降低,基础能力已基本完备。
此外,由达摩院牵头的“无剑联盟”已落地海尔家电体系,并吸引国芯科技、Canonical、千问、天翼云、SGS等新成员加入,围绕SoC定制、操作系统生态、AI模型与硬件融合、云计算应用及测试认证展开合作,加速RISC-V向终端场景渗透。
在孟建熠看来,RISC-V的意义不止于一套指令集,更在于其作为产业协同平台的属性,将分散的企业与能力整合为具备商业化潜力的整体生态。
他指出,随着合作伙伴参与程度加深,生态的技术回报已逐步显现。“大家可以看到工具的计算库,合作伙伴提供的产品可以比开源提高30%以上,推理性能也可以提高40%以上,所以更多人加入到生态中来,能够进一步增强整个生态的力量。”
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com