SON DAKİKA

Nvdia

Verimli ve Ölçeklenebilir AI Fabrikaları İçin 800 VDC Ekosisteminin Oluşturulması

Uzun yıllardır, geleneksel veri merkezleri geniş sunucu salonları olarak varlık gösteriyordu ve güç ile soğutma ikincil bir öneme sahipti. Ancak, generatif yapay zekanın yükselişi, bu tesisleri birer yapay zeka fabrikası haline dönüştürerek mimari anlayışı alt üst etti. Eskiden bir detay olarak görülen güç altyapısı, artık yeni kurulumların ölçeği, yeri ve uygulanabilirliği üzerinde belirleyici bir faktör haline geldi.

Endüstride kritik bir dönüm noktasındayız; artık artan iyileştirmelerle yetinilemeyecek bir noktaya geldik. Temel bir mimari değişim şart. Bu yeni yapı, daha verimli, ölçeklenebilir ve modern yapay zekanın güç taleplerini yönetebilecek kapasitede olmalı.

Güç Taleplerinin Artışı

Güç tüketiminde yıllar boyunca önemli bir işlemci teknolojisi ilerlemesi, genellikle yaklaşık %20’lik bir artış anlamına geliyordu. Ancak günümüzde bu öngörülebilir eğri bozuldu. Bunun arkasındaki sebeplerden biri, yüksek bant genişliğine sahip bağlantılar olan NVIDIA NVLink gibi teknolojilerin, binlerce GPU’nun tek bir monolitik işlemci gibi çalışmasına olanak tanımasıdır.

Düşük gecikme süreleri ve yüksek bant genişliği için bu bağlantılar, bakır kablolar kullanmak zorundadır. Ancak, bakırın etkili erişimi sınırlıdır; bu durum bir performans yoğunluğu tuzağı ortaya çıkarmaktadır. Daha güçlü bir yapay zeka sistemi oluşturmak için, daha fazla GPU’nun daha küçük bir fiziksel alana yerleştirilmesi gerekmektedir. Bu mimari zorunluluk, performans ile güç yoğunluğunu doğrudan ilişkili hale getirir.

Volatilite Sorunsalı

Ayrıca, yalnızca yoğunluk değil, yapay zeka iş yükleri başka bir güçlü zorluk olan volatiliteyi de beraberinde getirir. Geleneksel bir veri merkezi, binlerce bağımsız görevle çalışırken, bir yapay zeka fabrikası tek bir senkron sistem olarak işlev görür. Büyük bir dil modelinin (LLM) eğitimi sırasında, binlerce GPU, yoğun hesaplamaların döngülerini gerçekleştirir ve hemen ardından veri alışverişine geçer. Bu, tesis genelinde büyük ve hızlı yük dalgalanmaları yaratan bir güç profili ortaya çıkarır.

Bu volatilite sorunu, NVIDIA, Microsoft ve OpenAI tarafından gerçekleştirilen ortak araştırmalarda belgelenmiştir. Araştırmalar, senkronize GPU iş yüklerinin şebeke ölçeğinde dalgalanmalara neden olabileceğini göstermektedir. Bir rack’in güç tüketimi, milisaniyeler içerisinde %30’luk “boşta” durumdan %100’e çıkabilir. Bu durum, mühendislerin, ortalama tüketim yerine maksimum akımı yönetmek için bileşenleri aşırı boyutlandırmasını zorunlu kılmakta, bu da maliyetleri ve alanı artırmaktadır.

Yeni Güç Dağıtım Mimarisi

Bu çok boyutlu krizle başa çıkmak için de çok yönlü bir çözüm gereklidir. Önerilen mimari plan, 800 VDC güç dağıtım sistemine geçişin yanı sıra entegre çok katmanlı enerji depolama ile birleşik bir strateji sunmaktadır.

800 VDC’nin Avantajları

Yüksek güç dağıtım zorluklarıyla başa çıkmanın en etkili yolu voltajı artırmaktır. Geleneksel 415 veya 480 VAC 3 faz sisteminden 800 VDC mimarisine geçiş yapmak, aşağıdaki önemli faydaları sağlar:

  • Doğal 800 VDC uçtan uca entegrasyon
    Tesis seviyesinde 800 VDC üretmek ve bunu doğrudan 800 VDC hesaplama kasalarına dağıtmak, redundant dönüşümleri ortadan kaldırarak genel güç verimliliğini artırır.
  • Daha az bakır ve maliyet
    800 VDC ile, aynı tel çapı 415 VAC’tan %157 daha fazla güç taşıyabilir. Bu, daha az bakır kullanarak maliyetleri ve montaj zorluklarını azaltır.
  • Artan verimlilik
    Doğal DC mimarisi, geleneksel sistemlerdeki pek çok verimsiz AC-DC dönüşüm adımını ortadan kaldırır, bu da %90’dan az bir verimlilikle sonuçlanabilir.
  • Basit ve daha güvenilir bir mimari
    DC dağıtım sistemi daha az bileşen ile daha basit bir yapı sunar; bu da daha az hata noktası ve sistem güvenilirliğini artırır.

Volatiliteyi Azaltma

800 VDC verimlilik sorununu çözse de iş yükündeki volatiliteyi ele almaz. Bu nedenle, enerji depolama, gücün aktif bir parçası olarak değerlendirilmelidir. Amacımız, GPU’ların kaotik güç taleplerini şebekenin stabilite gereksinimlerinden ayıran bir yastık oluşturmaktır.

Pdönemler arasında güç dalgalanmaları geniş bir spektrumda meydana geldiğinden, kısa süreli depolama (milisaniyelerden birkaç dakikaya kadar) gibi çok katmanlı bir strateji gerekmektedir:

  • Kısa süreli depolama: Yüksek güçlü kapasitörler ve süperkapasitörler, hesaplama kasalarına yakın bir yerde yer alacaktır. Bu bileşenler, yüksek frekanslı güç zirvelerini emip, iş yüklerinin ara boşluklarını dolduracaktır.
  • Uzun süreli depolama: Büyüklük olarak hızla değişen güç dalgalanmalarını yönetmek için büyük enerji depolama sistemleri (BESS) tesisin enerji şebekesine bağlı olacaktır. Bu, yedek jeneratörlere geçiş sırasında geçiş kabiliyeti sağlar.

Gelecekteki Yapay Zeka Fabrikalarında 800 VDC Uygulaması

Gelecekteki yapay zeka fabrikaları, mevcut AC dağıtım sisteminden 800 VDC dağıtım modeline geçiş yapacak. Mevcut mimari, çok sayıda güç dönüşüm aşamasını içeriyor. Bunun yerine, 800 VDC altyapısı ile, tesis güç takvimleri daha basit hale getirilecektir. Bu, tesisteki enerji depolamanın doğrudan entegrasyonunu da sağlar.

NVIDIA’nın MGX mimarisi, yeni NVIDIA Kyber raf mimarisiyle evrim geçirecek ve 800 VDC mimarisini benimseyecektir. Güç doğrudan her hesaplama düğümüne dağıtılmıştır; önce yüksek oranda verimli bir 64:1 LLC dönüştürücü, güç düşürülerek GPU’ya ulaştırılacaktır. Bu tek aşamalı dönüşüm, geleneksel çok aşamalı yaklaşımlara göre %26 daha az yer kaplar.

İş Birliği İhtiyacı

Bu dönüşüm tek başına gerçekleştirilemez. Hızlı, odaklanmış ve endüstri genelinde bir iş birliği gerekmektedir. Open Compute Project (OCP) gibi organizasyonlar, güç sistemlerinin standartlarının geliştirilmesi için kritik bir forum sunmaktadır. Endüstri, 800 VDC ortamları için ortak voltaj aralıkları ve güvenlik uygulamalarının belirlenmesinde birleşmelidir.

NVIDIA, veri merkezi elektrik ekosisteminde önemli iş ortaklarıyla iş birliği yaparak, bu süreçte destek sağlamak amacıyla teknik bir beyaz kitap yayınlamaktadır. İlgilenen şirketler için daha fazla bilgi almak adına iletişim kurulabilir.

Kaynak

Nvdia Blog

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri