你的位置:雅博体育app中国官网入口 > 2026世界杯 > 雅博app官网入口 谷歌一篇著述吓坏商场,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东谈主对工夫一窍欠亨
雅博app官网入口 谷歌一篇著述吓坏商场,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东谈主对工夫一窍欠亨
发布日期:2026-03-27 14:48    点击次数:146

雅博app官网入口 谷歌一篇著述吓坏商场,三星电子、SK海力士、好意思光等巨头市值一天挥发6200亿元,分析师:看来许多东谈主对工夫一窍欠亨

从“算力期间”投入“推理期间”,AI对内存的需求激增,大幅提振了全国存储公司功绩和股价。

但谷歌的一篇著述,让好意思国和韩国的内存巨头市值一天挥发了超900亿好意思元(约合东谈主民币6200亿元)。

当地时辰3月24日,谷歌究诘院(Google Research)发布了一篇先容名为TurboQuant的向量量化压缩算法的著述,声称在不耗损准确率前提下,将大模子运行时的关键内存占用压缩至3比特(原有内存占用的1/6)。

有商场不雅点以为,这一算法将减少AI对内存的需求。

但也有分析师称,商场的反应讲明,许多东谈主对工夫“一窍欠亨”。

谷歌发布新算法,存储巨头市值挥发逾6200亿元

当地时辰3月24日,谷歌发布名为TurboQuant的内存压缩算法。谷歌方面暗意,TurboQuant不错在不耗损准确性的情况下,将大型谈话模子运行时的关键部分——键值缓存(KV Cache)的内存占用减少为原有的1/6,同期在英伟达H100GPU上的特定测试中,性能可擢升高达8倍。

这一音书飞快触发商场重估逻辑。

富国银行分析师Andrew Rocha以为,这项工夫可能影响往日对内存容量规格的需求判断。他在申报中写谈:“商场很快就会从头评估,AI究竟还需要些许内存容量。”

当地时辰3月25日,即音书发布后的第一个好意思股交游日,存储芯片板块在盘中集体跳水。闪迪(SanDisk)股价一度大跌6.5%,收盘时跌幅收窄至3.5%,市值耗损36.3亿好意思元。同日,好意思光科技(Micron Technology)下降3.4%,市值耗损151.66亿好意思元;西部数据(Western Digital)下降1.63%,市值耗损16.64亿好意思元;希捷科技(Seagate Technology)下降2.76%,市值耗损21.4亿好意思元。3月26日开盘,存储芯片板块不竭集体下降。

负面厚谊飞快扩散至亚洲商场。3月26日,韩国SK海力士股价下降6.23%,市值耗损44.18万亿韩元(约合293.8亿好意思元);三星电子也下降了4.71%,市值耗损57.83万亿韩元(约合384.5亿好意思元)。

全国主要内存巨头市值耗损计计超900亿好意思元(约合东谈主民币6200亿元)。

直击大模子“本钱痛点”:KV缓存占用减少83%

TurboQuant激励升沉的中枢,在于其精确击中了大模子的关键本钱痛点——KV缓存(Key-Value Cache)。

在大模子推理进程中,模子需要保存历史险阻文信息造成KV缓存,以幸免相通诡计。但跟着险阻文窗口增长,KV缓存呈线性推广,占用浩荡GPU内存。

举例,一个700亿参数模子在512用户、2048 Token输入场景下,仅KV缓存就需约512GB内存,约为模子推行的4倍,已成为买卖化部署中的最大本钱之一。

传统措置有接头是“量化”,即用低精度数据替代高精度浮点数,但时常就义准确率,且还需稀奇存储量化参数,对消部分压缩收益。

TurboQuant通过两步优化措置这一问题。

第一步,讹诈名为PolarQuant的圭表,将数据从笛卡尔坐标调度为极坐标,访佛于“向东走3米,雅博app官网入口向北走4米”的教唆,简化为“以37度角走5米”。通过当场旋转让数据漫步可预计,从而无需稀奇量化参数,径直减少内存支出。

第二步,再讹诈名为QJL(量化约翰逊-林登施特劳斯变换)的工夫,用只是1个比特来修正第一步压缩后产生的轻浅罪状,确保最终放手的准确性。

谷歌暗意,通过该组合有接头:

◆KV缓存可压缩至3比特,内存占用减少为原有的1/6(降幅约83%);

◆在Gemma、Mistral等模子测试中,性能与未压缩模子一致,无需稀奇试验或微调;

◆在NVIDIA H100测试中,4比特TurboQuant驻防力诡计速率达到32位未量化的8倍。

华尔街舌战:从简缓存便是减少内存总需求吗?

尽管商场短期剧烈反应,但机构不雅点较着分化。

领先,这项工夫并非初度知道,臆测论文早在2025年4月已公开。

其次,有分析指出,谷歌所谓的“8倍性能擢升”是与32位未量化模子对比得出,而面前主流已浩荡采取4位量化,推行擢升或低于宣传值。

商场分析机构Citrini Research分析师Jukan直言,因TurboQuant导致内存股暴跌,反应出商场对工夫“一窍欠亨”,就像丰田推出混动发动机却让石油公司暴跌同样。

摩根士丹利则指出,TurboQuant工夫的影响边界是有限的。它仅作用于推理阶段KV缓存,不影响模子权重,也不触及试验圭臬。因此,这并不虞味着举座存储需求下降到原来的1/6,而是擢升单元硬件后果,让调换的硬件能处理更长的险阻文或就业更多用户。

此外,摩根士丹利征引“杰文斯悖论”(Jevons Paradox),该表面以为,后果擢升时常不会减少资源破钞,反而会因本钱下降而刺激需求增长。就像瓦特检阅蒸汽机提高了煤炭燃烧后果,放手却是全国煤炭需求量的飙升同样。摩根士丹利以为,通过大幅镌汰单次查询的就业本钱,TurboQuant大概让底本只可在云霄奋斗集群上运行的模子移动至土产货,有用镌汰AI边界化部署的门槛,这可能反而能进一步提振举座需求。

Cloudflare首席践诺官Matthew Prince将TurboQuant称为谷歌的“DeepSeek时刻”。访佛情况曾在DeepSeek发布时出现:商场一度担忧算力需求下降,但最终AI应用爆发,反而推高硬件需求。一运转下降的英伟达自后再创历史新高。

从行业规章“内存帕金森定律”来看,TurboQuant从简的内存不会闲置,而会被飞快破钞:每一轮硬件升级或软件优化开释出来的存储余量,很快就会被更长的险阻文窗口、更大的批处理边界、更复杂的推理需求所归拢。换言之,从简下来的空间将被用于就业更多并发央求、处理更长的文档,或者运行底本因内存不及而无法加载的大模子,以致可能鼓吹更繁多的AI应用在手机等出动设备上成为现实。

免责声明:本文内容与数据仅供参考雅博app官网入口,不组成投资提出,使用前请核实。据此操作,风险自担。

澳门十大赌城官方网站