周三美股盘中,存储芯片板块遭遇显著回调。西部数据(WDC)和美光科技(MU)均跌超4%,希捷科技(STX)跌幅超5%。
引发这一轮集体走弱的直接原因,是谷歌刚刚发布了一项名为TurboQuant的新型AI内存压缩技术,引发了市场对存储硬件中长期需求前景的担忧。
要理解为什么一个“软件算法”的进步会吓坏“卖硬件”的公司,我们得先搞清楚大模型运行时最占资源的地方——键值缓存(KV Cache)。
当你在和AI对话,或者让它处理长文章时,为了记住前面的内容(上下文),AI必须在内存里实时暂存大量数据。这就像一个人为了记住长篇大论,脑子里得塞满临时的笔记。这些“临时笔记”不仅极其占用昂贵的存储空间,还拖慢了AI的反应速度,限制了它能同时服务多少人。
谷歌推出的TurboQuant技术,正是为了精准攻克这一硬件痛点。根据公开测试数据,该技术能够在完全不损失大模型准确性、且无需重新训练的前提下,将键值缓存直接压缩至原先的六分之一。
同时,在英伟达H100加速器上,处理性能最高提升了8倍。这意味着,原本需要大量高昂内存硬件才能支撑的长上下文推理运算,现在通过底层数据结构的“瘦身”,用极少的内存空间就能高效完成。
面对这种“以软代硬”的技术跨越,资本市场的第一反应往往是高度防御性的。既然单张显卡的内存吞吐效率被成倍放大,市场自然会推演:各大云服务商和企业客户未来对存储芯片的物理采购总量,是否会因此出现断崖式下滑?
叠加存储板块今年以来已经累积了较为可观的涨幅,整体估值处于相对高位。在当前容错率极低的市场环境下,任何可能削减底层硬件采购量的边际技术进展,都足以促使机构资金选择提前获利了结。
尽管投行如摩根士丹利随后指出,这种效率提升主要集中在推理阶段的缓存压缩,并不影响模型权重所需的高带宽内存(HBM)。且从长远经济学角度看,这可能触发“杰文斯悖论”:AI运行成本的大幅降低将使规模化部署门槛骤降,进而激活更多应用场景,最终反而推升硬件总需求。
但对于当下的盘面而言,远期的产业推演往往让位于短期的“削减需求”恐慌,高估值叠加新技术冲击,共同构成了今天存储股集体下挫的核心逻辑。
本文来自微信公众号“美股投资网”
作者:StockWe.com
该文观点仅代表作者本人


