TurboQuant sproži sunkovit padec delnic pomnilniških družb, a zgodba o HBM za AI ostaja nespremenjena

Googlov novi algoritem obljublja, da bo za šestkrat zmanjšal pomnilniške zahteve modelov umetne inteligence. Delnice podjetij Samsung, SK Hynix in Micron padajo zaradi strahu pred zmanjšanjem povpraševanja.

Na prvi pogled se zdi, da se je začel konec pomnilniškega supercikla, v resnici pa gre morda bolj za paničen odziv trga na zapleteno tehnološko napoved. TurboQuant je medtem laboratorijski preboj, ki se osredotoča predvsem na učinkovitejše sklepanje in mainstream DRAM, medtem ko strukturna zgodba o visokozmogljivem HBM - ključnem gorivu za usposabljanje velikih modelov umetne inteligence - ostaja nedotaknjena in še naprej trpi zaradi pomanjkanja ponudbe, rastočega povpraševanja in močnih temeljev v korist velikih proizvajalcev pomnilnika.

Prelomna tehnologija sproža paniko na trgu

Google Research $GOOG je predstavil nov algoritem za stiskanje pomnilnika, imenovan TurboQuant , za katerega raziskovalci pravijo, da lahko ključni predpomnilnik, ki se uporablja v velikih jezikovnih modelih, stisne vsaj šestkrat hitreje z do osemkrat hitrejšim sklepanjem, ne da bi pri tem žrtvoval natančnost.

Odziv trga je bil takojšen in dramatičen. V četrtek so delnice dveh največjih svetovnih proizvajalcev pomnilniških čipov, SK Hynix in Samsung $SSNLF, v južnokorejskem trgovanju padle za 6 % oziroma skoraj 5 %. Družba Samsung Electronics je zaključila trgovanje s 4,71-odstotnim padcem, SK Hynix pa s 6,23-odstotnim, kar je južnokorejski indeks KOSPI potegnilo navzdol za 3,22 %.

Podoben trend se je nadaljeval na ameriških trgih, kjer so se delnice podjetij, kot sta Micron Technology $MU, ki so padle za 7 % , in SanDisk $SNDK, ki so padle za 6,8 % . Ta gibanja so sledila padcem delnic podjetij SanDisk in Micron v ZDA v sredo.

Kako deluje orodje TurboQuant in zakaj je strah vlagateljev

TurboQuant predstavlja revolucionaren pristop k reševanju enega največjih ozkih grl umetne inteligence - ogromnih potreb po pomnilniku med operacijami sklepanja. TurboQuant je metoda stiskanja, ki omogoča veliko zmanjšanje velikosti modela z ničelno izgubo natančnosti, zaradi česar je idealna za podporo stiskanja ključnih predpomnilnikov (KC) in vektorskega iskanja.

Tehnologija deluje v dveh fazah. V prvi fazi se uporablja tehnologija PolarQuant, ki drugače razmišlja o preslikavi visokodimenzionalnega prostora. Namesto standardnih kartezičnih koordinat (X, Y, Z) PolarQuant pretvori vektorje v polarne koordinate, sestavljene iz polmera in niza kotov. Preboj je v geometriji: po naključni rotaciji postane porazdelitev teh kotov zelo predvidljiva in zgoščena.

Druga faza deluje kot popravljalnik matematičnih napak. Kljub učinkovitosti programa PolarQuant ostane še vedno nekaj preostalih napak. TurboQuant za te preostale podatke uporabi 1-bitno kvantizirano Johnson-Lindenstraussovo (QJL) transformacijo.

Dejanski vpliv na trg ostaja vprašanje.

Kljub takojšnjemu odzivu trga analitiki svarijo pred pretirano zaskrbljenostjo. Ray Wang, pomnilniški analitik pri podjetju SemiAnalysis, je dejal, da Googlove raziskave ne bodo nujno povzročile potrebe po manjšem številu čipov. Vrednosti predpomnilnika so "ključno ozko grlo, ki ga je treba obravnavati za boljše modele in zmogljivost strojne opreme," je dejal. Wang je dejal, da se bo "težko izogniti večji porabi pomnilnika" zaradi izboljšanja zmogljivosti modelov .

Prav tako je pomembno razlikovati med različnimi vrstami pomnilnika. Opozoriti je treba, da bo ta tehnologija v primerjavi s standardnimi čipi DRAM manj vplivala na HBM (High Bandwidth Memory). TurboQuant se uporablja predvsem za optimizacijo sklepanja modelov umetne inteligence, kar je faza, ki večinoma zahteva le običajne čipe DRAM. Vendar pa HBM ostaja nujen v fazi usposabljanja umetne inteligence.

Po poročanju CNBC kljub četrtkovemu padcu delnic popolna nevihta dejavnikov še naprej dolgoročno podpira trg pomnilnikov. Zaradi velikega povpraševanja in pomanjkanja ponudbe so se cene pomnilnika dvignile na doslej nezaslišano raven, kar je pripomoglo k dobičkom podjetij Samsung, SK Hynix in Micron.

Strukturni temelji ostajajo trdni

Ključno je tudi vedeti, da je TurboQuant še vedno le raziskovalni projekt. Treba je omeniti, da TurboQuant še ni bil uporabljen v večjem obsegu; trenutno je še vedno laboratorijski preboj. Zaradi tega je primerjava s platformo DeepSeek ali celo z izmišljenim podjetjem Pied Piper težja.

Podatki kažejo, da se bo trg HBM leta 2026 povečal za 58 % na 54,6 milijarde dolarjev in bo predstavljal skoraj 40 % trga DRAM. Nenadno povečanje povpraševanja je povzročilo neravnovesje med ponudbo in povpraševanjem. Kljub temu da so Samsung, SK Hynix in Micron 70 % svojih novih/dodatnih zmogljivosti namenili HBM, ostaja 50-60 % vrzeli v zmogljivostih za HBM.

Po mnenju analitikov družbe Wells Fargo bi lahko bila posodobitev Googlovega programa TurboQuant dejansko pozitivna za pomnilniška podjetja. Čeprav se tovrstni preboj morda zdi negativen za pomnilniška podjetja, ideja Jevonsovega paradoksa kaže, da se lahko zgodi ravno nasprotno - učinkovitejša umetna inteligenca zmanjša stroške, kar lahko dejansko spodbudi veliko širšo uporabo in povpraševanje.

Strukturni dejavniki, povezani z infrastrukturo za umetno inteligenco, omejitvami pri dobavi in omejenimi trgi HBM, podpirajo odporne dolgoročne obete. Vlagatelji bi morali razlikovati med kratkoročnim šumom in temeljnimi trendi, zasidranimi v trajnem pomanjkanju pomnilnika in povečanju delovne obremenitve umetne inteligence .