欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年03月27日 星期五 农历:丙午(马)年-二月-初九
您现在的位置是:首页 > 头条

存储芯片股集体重挫 AI新技术冲击市场

沄森™2026-03-27
3月27日,媒体报道称,美东时间3月26日,存储芯片股集体下跌,其中闪迪跌幅超过11%,希捷跌幅超过8%,超威半导体、西部数据跌幅超过7%,美光科技跌幅接近7%

存储芯片股集体重挫 AI新技术冲击市场。3月27日,媒体报道称,美东时间3月26日,存储芯片股集体下跌,其中闪迪跌幅超过11%,希捷跌幅超过8%,超威半导体、西部数据跌幅超过7%,美光科技跌幅接近7%。这一市场波动源于谷歌研究院即将在国际学习表征会议(ICLR 2026)上发布的一篇学术论文,该研究介绍了一种名为“TurboQuant”的新型AI内存压缩技术。

存储芯片股集体重挫

谷歌表示,这项技术可以将大语言模型推理过程中的缓存内存占用减少至原来的六分之一,并且在英伟达H100 GPU上实现最高8倍的性能加速。AI模型运行时会使用一种称为KV缓存的工作内存,这种缓存随着处理信息和生成回答而迅速膨胀,特别是在上下文窗口较长的情况下。TurboQuant是一种极致的量化压缩算法,通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项创新,在不损失精度的前提下将KV缓存压缩至3-bit精度。

Cloudflare首席执行官认为,这项成果可能是谷歌的一个重要突破,有望大幅降低AI的运行成本。然而,摩根士丹利在最新研报中指出,市场对这项技术存在误解。该技术仅作用于推理阶段的键值缓存,并不影响模型权重所占用的高带宽内存(HBM),也不涉及AI训练任务。分析师解释说,“6倍压缩”并不是指存储总需求减少,而是通过效率提升增加单GPU的吞吐量,从而支持更长的上下文或更大的批处理规模。

目前,谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表,相关研究成果计划在下个月的ICLR 2026会议上正式发布。

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com