Elon Musk’ın Yeni Süper Bilgisayarı xAI Colossus Detaylandı
Elon Musk’ın pahalı yeni projesi, xAI Colossus AI süper bilgisayarı, ilk kez detaylı bir şekilde açıklandı. YouTuber ServeTheHome, 100.000 GPU’lu bu canavarın içindeki Supermicro sunucularına erişim izni verildi ve süper bilgisayarın çeşitli yönleri sergilendi. Musk’ın xAI Colossus süper kümesi neredeyse iki aydır çevrimiçi olarak çalışıyor, 122 günlük bir montajın ardından.
100.000 GPU Kümesinde Neler Var?
Patrick, ServeTheHome’dan, sunucunun çeşitli bölümlerini kamerayla gezerek operasyonları hakkında genel bir bakış sunuyor. Güç tüketimi ve pompa büyüklüğü gibi süper bilgisayarın daha ince detayları, bir gizlilik sözleşmesi gereği açıklanamazdı ve video yayına çıkmadan önce xAI, videoyu yayınlanmadan önce bazı kısımları bulanıklaştırdı ve sansürledi. Fakat Supermicro GPU sunucuları gibi en önemli detaylar yukarıdaki görüntülerde neredeyse doğal halleriyle bırakıldı.
GPU sunucuları Nvidia HGX H100’lerdir, her biri sekiz adet H100 GPU içeren bir sunucu çözümü. HGX H100 platformu, her bir GPU’ya kolayca sıcak değiştirilebilir sıvı soğutma sağlayan Supermicro’un 4U Evrensel GPU Sıvı Soğutmalı sistemine paketlenmiştir. Bu sunucular, her biri sekiz sunucu barındıran raflara yüklenir, her rafta 64 GPU bulunur. HGX H100’ler arasına yerleştirilen 1U manifoldlar, sunucuların ihtiyacı olan sıvı soğutmayı sağlar. Her raftın altında başka bir Supermicro 4U ünitesi bulunur, bu sefer yedekli bir pompa sistemi ve rafların izlenmesi için bir sistem içerir.
Bu raflar sekizli gruplar halinde eşleştirilir ve her bir dizide 512 GPU bulunur. Her sunucunun dört yedekli güç kaynağı vardır, GPU raflarının arka kısmı ise 3 fazlı güç kaynakları, Ethernet anahtarları ve tüm sıvı soğutmayı sağlayan raflık bir manifoldu ortaya çıkarır. Colossus kümesi içinde 1.500’den fazla GPU rafı bulunur veya neredeyse 200 raftan oluşan bir dizi vardır. Nvidia CEO’su Jensen Huang’a göre, bu 200 dizinin GPU’ları tamamen üç haftada kurulmuştur.
Colossus’un Kullanımı ve Musk’ın Süper Bilgisayar Çiftliği
xAI Colossus süper bilgisayarı şu anda Nvidia’ya göre dünyanın en büyük yapay zeka süper bilgisayarıdır. Dünyanın önde gelen birçok süper bilgisayarının hava durumu modelleri, hastalıklar veya diğer zor hesaplama görevleri için birçok yüklenici veya akademisyen tarafından kullanılabilen araştırma platformları olduğu düşünüldüğünde, Colossus sadece X’in (eskiden Twitter) çeşitli yapay zeka modellerinin eğitiminden sorumludur. Başlıca olarak Grok 3, Elon’ın “anti-uyanık” sohbet robotu, sadece X Premium aboneleri tarafından erişilebilir. ServeTheHome’a aynı zamanda Colossus’un “geleceğin” yapay zeka modellerini eğittiği söylendi; kullanımları ve yetenekleri iddia edildiğine göre bugünün bayrak gemisi yapay zekasının güçlerinin ötesindedir.
Colossus’un inşasının ilk aşaması tamamlanmış durumda ve küme tamamen çevrimiçidir, ancak her şey bitmiş değil. Memphis süper bilgisayarı yakında GPU kapasitesini ikiye katlayacak şekilde yükseltilecek, 50.000 daha H100 GPU ve 50.000 yeni nesil H200 GPU ile. Bu aynı zamanda güç tüketimini ikiye katlayacak ve zaten Temmuz ayında siteye eklenen Musk’ın 14 dizel jeneratörünün kaldıramadığı bir güç tüketimi seviyesine ulaşacak. Ayrıca, Musk’ın Colossus içinde 300.000 H200’ler olduğuna dair sözünün çok altında kalıyor, ancak bu muhtemelen yükseltmelerin üçüncü aşaması haline gelebilir.