Strežniki z umetno inteligenco, hlajeni s tekočino, se soočajo z ozkimi grli
Sep 30, 2024
Pustite sporočilo
S povečanjem pošiljk čipov Blackwell se bo povečala tudi pripravljenost strank za uporabo tekočinskega hlajenja.
Poznavalci industrije poročajo, da postaja dobava univerzalnih naprav za hitro odklop (UQD) za rešitve za tekoče hlajenje omejena, kar lahko postane glavno ozko grlo za rast tekočega hlajenja strežnikov z umetno inteligenco.
Proizvajalci strežnikov ODM navajajo, da se bodo Nvidijini čipi Blackwell AI, vključno z B100 in B200, začeli dobavljati letos, medtem ko rešitev GB200 ne bo vstopila v množično proizvodnjo do konca leta 2024 ali 2025. Večina kupcev B100 in B200 še vedno uporablja zasnove zračnega hlajenja. , vendar proizvajalci ODM poročajo o nenehnem povečevanju prodora tekočinskega hlajenja, pri čemer pričakujejo, da se bo s povečanjem pošiljk čipov Blackwell povečala tudi pripravljenost strank za uporabo tekočinskega hlajenja.

▲ Strežniki z umetno inteligenco, hlajeni s tekočino
I Širitev zmogljivosti za zadovoljitev naraščajočega povpraševanja po tekočinskem hlajenju
Ustrezna podjetja širijo proizvodnjo, da bi pozdravila novo dobo tekočinskega hlajenja. Proizvajalec termalnih modulov Amlogic namerava povečati svojo mesečno proizvodno zmogljivost vodno hladilnih plošč s 30,000 na 300,000 enot.
Podjetje Auras je postavilo novo tovarno na Tajskem, da bi odgovorilo na geopolitične skrbi in zahteve strank. Ta tovarna naj bi začela množično proizvodnjo v tretjem četrtletju. Poleg razširitve lokalne proizvodne zmogljivosti za hladilne plošče načrtuje Auras tudi lokalno proizvodnjo hladilnih razdelilnih enot (CDU) in razdelilnikov hladilne tekočine (CDM) z načrtovano mesečno zmogljivostjo približno 2,000-3,{{2 }} nizov.
Proizvajalec termalnih modulov AVC je v svojem nedavnem razpisu zaslužka navedel, da je njegova mesečna proizvodna zmogljivost modulov hladilnih plošč na Kitajskem in v Vietnamu približno 115000 enot, kar pomeni mesečno proizvodnjo približno 420000 enot, ko izračunano s hladilnimi ploščami.
AVC namerava do konca leta povečati svoje zmogljivosti za 50 %. AVC prav tako načrtuje povečanje svoje mesečne proizvodne zmogljivosti za CDU na 1,000 enoto in za CDM na 30,000 sklopov. AVC je poudaril, da je to načrtovano zmogljivost mogoče prilagodljivo prilagajati glede na zahteve strank.
Podjetje Thermo Technology Goli Thermal Processing širi svoje zmogljivosti v tovarni Zhongli na Tajvanu zaradi povečanega povpraševanja strank po tekočinskem hlajenju. Do konca tretjega četrtletja naj bi se mesečna zmogljivost za CDM povečala z 1,000 enot na 2,000 enoti, do konca leta pa na 4,{{5} } enot, pri čemer se pričakuje, da bo letna proizvodnja CDU do konca leta dosegla 2,000 enot.
Ti proizvajalci imajo visoka pričakovanja glede povpraševanja po tekočinskem hlajenju, predvsem zaradi računalniške učinkovitosti in standardov PUE za podatkovne centre na Kitajskem in v EU, vendar je najpomembnejši dejavnik Nvidia, ki je odpravila samonaložene omejitve toplotnih specifikacij za proizvajalce čipov.
II Hitra rast tekočinskega hlajenja vodi v pomanjkanje UQD
Ker industrija nestrpno pričakuje prihod dobe tekočega hlajenja, je UQD postalo največje ozko grlo rasti. Proizvajalci toplotnih modulov so poudarili, da je ponudba UQD v zadnjem času postala tesna. Čeprav je trenutni tržni delež tekočinskega hlajenja le enomesten, bo UQD morda težko dobiti, če bo v prihodnosti narasel na dvomestno številko.
Dobavitelji UQD prihajajo predvsem iz Evrope in ZDA, kot so velika ameriška podjetja Parker Hannifin in CPC, švicarski Staubli International, danski Danfoss in švedski Cejn. Tajvanski velikan konektorskih komponent Lotes prav tako aktivno vstopa na trg in je začel z dobavo vzorcev.
Predsednik Anbo Technology, Liang Zhijian, je poudaril, da ker je cilj tekočinskega hlajenja predvsem preprečiti puščanje in so komponente UQD najbolj nagnjene k puščanju, je dobava UQD najbolj omejena med komponentami tekočinskega hlajenja. To ni samo tehnično vprašanje; ustrezni proizvajalci imajo tudi patentno zaščito in Anbo Technology raziskuje načine, kako prebiti te patentne ovire.
Poznavalci industrije so ugotovili, da imajo proizvajalci UQD patentno zaščito, vendar morajo opraviti tudi več validacij, vključno s certifikacijo OCP in validacijami strank, kar je dolgotrajno in delovno intenzivno. Poleg tega obstoječi evropski in ameriški proizvajalci nimajo namena širiti zmogljivosti, kar bo postalo glavno ozko grlo za hiter razvoj tekočinskega hlajenja.
Supermicro je eden najhitreje rastočih proizvajalcev tekočinskega hlajenja. Ustanovitelj in izvršni direktor Liang Jianhou je poudaril, da je tekoče hlajenje v zadnjih 30 letih predstavljalo le 1 % trga strežnikov, vendar ocenjuje, da bo do leta 2025 stopnja prodora poskočila na 30 %.
III Tekočinsko hlajenje kot možna rešitev; AI boom pritiska na mrežo
Hiter razvoj generativne umetne inteligence je povzročil izjemno širitev podatkovnih centrov, kar je povzročilo zaskrbljenost glede njihovega vpliva na električno omrežje. Ti energetsko intenzivni objekti bi lahko povzročili izpade električne energije in povečali stroške energije. Po ocenah Inštituta za raziskave električne energije bi podatkovni centri do leta 2030 lahko porabili 9 % električne energije v ZDA, kar bi podvojilo trenutno številko. Poraba električne energije velikega podatkovnega centra je enakovredna porabi več sto tisoč gospodinjstev.
Še posebej zaskrbljujoče je naraščajoče povpraševanje po energiji umetne inteligence. Zgodnji modeli AI so porabili desetkrat več energije kot iskanje v Googlu, medtem ko novejši čipi zahtevajo še več energije. Strokovnjaki opozarjajo, da bo prihodnji razvoj umetne inteligence morda omejen z našo sposobnostjo ustvarjanja zadostne moči.
Nekatere države se soočajo s hudimi izzivi. Na primer, do leta 2026 bo Irska morda imela 30 % svoje električne energije namenjene podatkovnim centrom. V ZDA je poraba električne energije v podatkovnih centrih skoncentrirana v 15 zveznih državah, pri čemer sta največji v Teksasu in Virginiji. Kalifornija je v kritični situaciji, saj naj bi novi podatkovni centri proizvedli večje potrebe po električni energiji kot jedrske elektrarne.
Podatkovni centri IV: velika poraba energije in porast tekočinskega hlajenja
Računalniške zahteve umetne inteligence zvišujejo temperature strežnikov in emisije ogljika, kar povzroča znatno povečanje povpraševanja po hladilnih sistemih. Hladilni sistemi predstavljajo 40 % celotne porabe energije podatkovnega centra, zaradi česar so drugi največji vir porabe energije za samimi strežniki. Svetovni trg za hlajenje strežnikov naj bi zrasel z 20 milijard USD leta 2024 na 90 milijard USD do leta 2027. Pričakuje se, da se bo trg sistemov za tekoče hlajenje v podatkovnih centrih povečal z 1 % na 22 %, pri čemer naj bi tržna vrednost narasla s 317 milijonov USD na 7,8 milijarde dolarjev v naslednjih treh letih.
Rešitve s tekočim hlajenjem, ki za hlajenje strežnikov uporabljajo vodo ali hladilna sredstva, postajajo vse bolj priljubljene. Nove tehnologije vključujejo potopno hlajenje (potopitev celotnih strežniških omaric v neprevodne tekočine) in neposredno tekočinsko hlajenje (kroženje vode okoli strežnikov). Čeprav je trenutno dražje od sistemov zračnega hlajenja, lahko tekočinsko hlajenje zmanjša porabo energije podatkovnega centra za 10 % ali več.
Raziskovalno podjetje Global Market Insights napoveduje, da bo svetovni trg tekočinskega hlajenja za podatkovne centre zrasel z 2,1 milijarde USD leta 2022 na 12,2 milijarde USD do leta 2032. Raziskava Uptime Institute je pokazala, da 16 % vodij podatkovnih centrov verjame, da bo tekočinsko hlajenje postalo primarno hlajenje metoda v 1-3 letih, medtem ko 41 % meni, da bo trajalo 4-6 let. Zato je bolj verjetno, da se bodo hibridne metode hlajenja pojavile v kratkem času.
Upsite Technologies, vodilni pri upravljanju sistemov zračnega hlajenja za podatkovne centre, je ugotovil, da čeprav tehnologija nenehno napreduje, je doseganje 100 % tekočinsko hlajenih podatkovnih centrov kratkoročno malo verjetno, saj oprema za hlajenje s tekočino še vedno zahteva zračno hlajenje za odvajanje toplote. . Čeprav je tekočinsko hlajenje učinkovitejše, ga je težko implementirati v velikem obsegu in zahteva znatne vnaprejšnje naložbe. Zračno hlajenje je cenejše, a tudi manj učinkovito. Hibridne hladilne naprave tako postajajo vse bolj priljubljene, da bi povečali prednosti tekočinskega in zračnega hlajenja.
V Energetska kriza podatkovnih centrov zahteva nujno ukrepanje
Podatkovni centri so zaradi svojega vpliva na okolje deležni vse večje pozornosti. Vlade po vsem svetu izvajajo predpise za nadzor porabe energije in ogljičnega odtisa. Kitajske smernice "Green Data Center" in podobne pobude v Nemčiji, Singapurju in na Japonskem ponazarjajo ta trend. Strokovnjaki iz industrije, kot je Schneider Electric, poudarjajo potrebo po celovitih okoljskih meritvah za oceno trajnosti podatkovnih centrov, vključno z dejavniki, ki presegajo porabo energije, kot so vodni viri in nastajanje odpadkov.
Ameriška vlada pritiska na velika tehnološka podjetja, naj vlagajo v čisto energijo in se zavedajo pomembnega vpliva, ki ga imajo na okolje vse večje zahteve po moči umetne inteligence.
VI Iskanje ustreznih virov energije: podatkovni center in energetski izzivi
Podatkovni centri potrebujejo raznoliko mešanico energije, da uravnotežijo zanesljivost in trajnost ter hkrati izpolnjujejo vse večje zahteve. Obnovljivi viri energije, kot sta sonce in veter, so privlačni zaradi nizkega ogljičnega odtisa. Vendar pa lahko njihova odvisnost od vremenskih razmer privede do nestabilnega izhoda, zaradi česar niso primerni kot edini vir energije za podatkovne centre. Gradnja odvečnih objektov za kompenzacijo te nedoslednosti je morda potrebna, vendar draga.
Jedrska energija se je pokazala kot možna rešitev. Tradicionalne jedrske elektrarne zagotavljajo zanesljivo osnovno obremenitev in ustvarjajo stabilno električno energijo, ki je ključna za delovanje podatkovnih centrov. Poleg tega se pričakuje, da bo svetovni trg jedrske energije v naslednjem desetletju dosegel stalno rast.
Inovacije v jedrskem sektorju ponujajo obetavnejše možnosti. Mali modularni reaktorji (SMR) se razvijajo kot manjše, varnejše in bolj razširljive alternative tradicionalnim jedrskim elektrarnam. Čeprav so še vedno v fazi raziskav in razvoja, imajo SMR potencial za uporabo neposredno v podatkovnih centrih, ki zagotavljajo namensko čisto energijo.

▲ Globalni trg tekočinskega hlajenja (milijarde USD)
Vendar pa se široko sprejetje SMR sooča s precejšnjimi ovirami. Regulativni in proizvodni izzivi bi lahko odložili njihovo komercialno uporabo za več let. Vlada ZDA dejavno raziskuje rešitve, vključno s partnerstvi s tehnološkimi velikani za zmanjšanje stroškov in racionalizacijo procesov.
Drug način za zmanjšanje potreb podatkovnega centra po energiji je optimizacija delovnih obremenitev umetne inteligence. S prenosom nekaterih nalog umetne inteligence iz oblaka v lokalne naprave z manjšimi modeli umetne inteligence, ki zahtevajo manj virov, se lahko zmanjša skupna poraba energije.
Prihodnji razvoj podatkovnih centrov zahteva večplasten pristop. Bistvenega pomena je sprejetje raznolike mešanice energetskih virov, vključno z zanesljivimi viri energije, kot je jedrska energija, ob aktivnem iskanju obnovljivih in inovativnih rešitev, kot je SMR. Poleg tega lahko optimizacija delovnih obremenitev AI na lokalnih napravah dodatno spodbuja trajnost podatkovnih centrov.
