Streszczenie:Centra danych nagrzewają się coraz bardziej, ponieważ obciążenia AI wymuszają na układach scalonych wyższe poziomy mocy, a „po prostu wdmuchnij więcej powietrza” coraz bardziej nie wystarcza. Dlatego branża przechodzi na chłodzenie cieczą – od płyt chłodzących i kanałów mikroprzepływowych po pełne „prysznice” i kąpiele zanurzeniowe – aby utrzymać stabilność serwerów, ograniczyć zużycie energii na chłodzenie i (w niektórych przypadkach) ponownie wykorzystać ciepło odpadowe.
Rozwiązanie problemu chłodzenia niesie ze sobą jednak pewne kompromisy: wybór środków chemicznych (w tym obawy dotyczące czynników chłodniczych zawierających PFAS), bezpieczeństwo, koszty i ryzyko, że wzrost wydajności po prostu umożliwi jeszcze większy wzrost mocy obliczeniowej.
Dlaczego chłodzenie nagle ma tak duże znaczenie
Jeśli chcesz podać jeden powód:gęstość mocy.
Nowoczesne systemy AI wykorzystują stelaże wypełnione akceleratorami o wysokiej wydajności, które:
- zużywają znacznie więcej energii niż procesory ogólnego przeznaczenia
- generować ciepło na mniejszych powierzchniach fizycznych
- często działają blisko limitów wydajności
To sprawia, że chłodzenie jest ograniczeniem pierwszego rzędu. Awaria chłodzenia może doprowadzić do awarii całego obiektu.
BBC podaje przykład ze świata rzeczywistego: awaria systemu chłodzenia w USA, która zakłóciła technologię obrotu finansowego w CME Group, w wyniku czego po incydencie konieczne stało się uruchomienie dodatkowej mocy chłodniczej.
Problem chłodzenia powietrzem: fizyka i malejące zyski
Chłodzenie powietrzem jest proste i znane, ale może sprawiać problemy, gdy:
- ciepło jest skoncentrowane na małym obszarze
- musisz szybko i konsekwentnie usuwać ciepło
- moc wentylatora i zarządzanie przepływem powietrza zaczynają zużywać znaczną część energii
W pewnym momencie nie „chłodzisz chipów”, tylko „uruchamiasz tunel aerodynamiczny” wewnątrz budynku.
Co tak naprawdę oznacza chłodzenie cieczą (to nie jest jedna technologia)
„Chłodzenie cieczą” to rodzina podejść:
1) Chłodzenie bezpośrednio na chipie/chłodnica płytowa
Pętla cieczy przepływa przez płytkę przymocowaną do najgorętszych elementów.
Zalety:
- efektywne usuwanie ciepła u źródła
- dojrzałe wzorce inżynieryjne
Wady:
- nadal wymaga starannej instalacji hydraulicznej i zarządzania przeciekami
2) Chłodzenie natryskowe/prysznicowe
BBC opisuje konstrukcje, w których ciecz spływa lub opada na komponenty.
Zalety:
- może chłodzić wiele komponentów, nie tylko chipy
- potencjalnie zmniejsza potrzebę stosowania dużych wentylatorów
Wady:
- podnosi kwestie dotyczące chemii płynów, ich kompatybilności i konserwacji
3) Chłodzenie zanurzeniowe („kąpiele”)
Serwery (lub komponenty) zanurzone są w krążącym płynie dielektrycznym, który odprowadza ciepło.
Zalety:
- wysoka wydajność cieplna
- może umożliwić bardziej spójną pracę przy dużym obciążeniu
Wady:
- sprzęt musi być zaprojektowany/zatwierdzony do zanurzenia
- zmiany operacyjne (serwisowanie, wymiana części)
4) Chłodzenie dwufazowe (zmiana fazy ciekłej → gazowej)
Czynnik chłodniczy paruje, pochłaniając ciepło, co może być bardzo skuteczne.
Zalety:
- wysoka wydajność chłodzenia
Wady:
- zależy od czynników chłodniczych; niektóre mogą powodować obawy związane z klimatem lub bezpieczeństwem
Kompromis chemiczny: PFAS i czynniki chłodnicze
Jednym z niedostatecznie omawianych aspektów chłodzenia centrów danych jest wybór środków chemicznych.
BBC zauważa:
- niektóre systemy dwufazowe wykorzystują czynniki chłodnicze, które mogą zawierać PFAS
- niektóre czynniki chłodnicze mogą być silnymi gazami cieplarnianymi
- istnieją obawy dotyczące bezpieczeństwa związane z ulatnianiem się oparów w niektórych konstrukcjach
- niektóre firmy przechodzą na alternatywy niezawierające PFAS
Nawet jeśli system jest zaprojektowany w sposób odpowiedzialny, obowiązuje prosta prawda:
- jeśli skalujesz technologię do tysięcy lokalizacji, małe wskaźniki wycieków stają się dużymi wskaźnikami środowiskowymi
Zamknięty obieg wody: dlaczego jest ważny dla społeczności
Centra danych budzą coraz większe kontrowersje, ponieważ wiele z nich zużywa:
- duże ilości energii elektrycznej
- znaczna ilość wody (w zależności od konstrukcji chłodzenia)
Niektóre systemy chłodzenia cieczą wykorzystują wodę w obiegu zamkniętym do chłodzenia dielektrycznego płynu na bazie oleju, co zmniejsza ciągłe pobieranie wody.
To ma znaczenie polityczne. Lokalna opozycja często tworzy się wokół pytania: „dlaczego nasza sieć/woda miałaby służyć czyjejś sztucznej inteligencji?”.
Technologia chłodzenia staje się częścią społecznego przyzwolenia na działanie.
Ciepło odpadowe to szansa — ale tylko wtedy, gdy ktoś potrafi ją wykorzystać
BBC wspomina o kliencie, który planuje wykorzystać ciepło odpadowe z serwerów do:
- pokoje gościnne
- pranie
- basen
To właściwy kierunek z koncepcyjnego punktu widzenia: komputery zamieniają energię elektryczną w ciepło, więc ponowne wykorzystanie może poprawić ogólną wydajność.
Jednak skalowanie ponownego wykorzystania ciepła jest trudne, ponieważ wymaga:
- pobliskiego odbiorcy ciepła (budynki, baseny, sieci ciepłownicze)
- stałe dostosowanie popytu
- inwestycje infrastrukturalne
Jest to więc obiecujące, ale nie automatyczne.
Głębsze ryzyko: wydajność może zwiększyć całkowity popyt
Mamy tu do czynienia z klasycznym efektem odbicia:
- gdy coś staje się tańsze lub bardziej wydajne, ludzie robią to częściej
Jeśli chłodzenie cieczą drastycznie obniży zużycie energii chłodzącej, rynek może zareagować w następujący sposób:
- budowanie większej liczby centrów danych
- uruchamianie większych modeli
- mocniejsze naciskanie sprzętu
Ulepszenia w zakresie chłodzenia są więc cenne — ale nie gwarantują mniejszego całkowitego wpływu na środowisko, jeśli nie są połączone z:
- strategia sieci uwzględniająca emisję dwutlenku węgla
- przejrzystość w zakresie zużycia energii
- zachęty do zmniejszenia całkowitego śladu
Co obejrzeć dalej
- Które podejście do chłodzenia staje się dominujące(zimne płyty, zanurzenie, dwufazowe) według rodzaju obciążenia.
- Regulacje i normywokół czynników chłodniczych i PFAS.
- Opór społeczności:czy innowacje w zakresie chłodzenia zmniejszają lokalne zużycie wody i hałas.
- Projekty ponownego wykorzystania ciepłaprzejście od programów pilotażowych do powtarzalnych wdrożeń.
- Przejrzystość sztucznej inteligencjiJak zauważa BBC, badacze apelują o bardziej przejrzyste raportowanie zużycia energii dla poszczególnych modeli/produktów.
Podsumowanie
Chłodzenie staje się „ukrytą infrastrukturą” decydującą o tym, jak szybko może skalować się sztuczna inteligencja.
Chłodzenie cieczą może zmniejszyć zużycie energii i zapewnić wyższą wydajność, ale rodzi też nowe pytania dotyczące bezpieczeństwa chemicznego, wpływu na klimat oraz tego, czy wzrost wydajności służy zmniejszeniu zajmowanej powierzchni, czy też po prostu przyspieszeniu wzrostu mocy obliczeniowych.
Źródła
- BBC News (Technologia biznesu):https://www.bbc.com/news/articles/cp8zd176516o?at_medium=RSS&at_campaign=rss