NVIDIA Grace CPU, veri merkezi tasarımını dönüştürerek güç verimliliğini artıran bir performans sunuyor. Veri merkezi ölçeği için özel olarak tasarlanan Grace CPU, zorlu iş yüklerini daha düşük enerji tüketimi ile karşılamak için optimize edilmiştir.
NVIDIA, GPU’ların her iş yükünü hızlandırmadaki faydalarını vurguluyor. Ancak, karmaşık ve dallı kodu içeren bazı iş yükleri, örneğin grafik analitikleri, bu hızlandırmadan yararlanamaz. Bu tür iş yükleri, dolandırıcılık tespiti, operasyonel optimizasyon ve sosyal ağ analizi gibi popüler kullanım senaryolarında yaygındır.
Güç Verimliliği ve Performans
Veri merkezleri giderek artan enerji kısıtlamaları ile karşı karşıya kalırken, mümkün olduğunca fazla iş yükünü hızlandırmak ve geri kalanını en etkili işlemci üzerinde çalıştırmak kritik hale gelmiştir. Grace CPU, hem hızlandırılmış hem de yalnızca CPU’ya özgü görevleri idare edebilir, geleneksel CPU’lara kıyasla aynı güç altında %200’e kadar daha iyi performans sunar.
Grace CPU, 72 yüksek performanslı ve enerji verimli Arm Neoverse V2 çekirdeği ile donatılmıştır. Bu çekirdekler, NVIDIA’nın yüksek bant genişliğine sahip Scalable Coherency Fabric (SCF) ile bağlantılıdır. Bu yüksek bant genişliği, CPU çekirdekleri, önbellek, bellek ve sistem I/O arasındaki veri akışını kesintisiz hale getirerek geleneksel CPU’ların iki katı olan 3.2 TB/s’lik bisection bant genişliği sunar.
Grace CPU ayrıca, sunucu sınıfı güvenilirliği olan yüksek hızlı LPDDR5X belleği kullanarak, geleneksel DDR belleğinin sadece beşte biri enerji tüketimiyle 500 GB/s’ye kadar bellek bant genişliği sağlıyor.
Standart Yazılım Altyapısı
Grace CPU, dengeli bir genel amaçlı CPU olarak tasarlanmış olup, diğer x86 CPU’larda olduğu gibi çalışmaktadır. Yazılımları Grace CPU üzerinde çalıştırmak için kullanılan iş akışı, herhangi bir x86 CPU’da kullanılan iş akışı ile aynıdır. Standart Linux dağıtımları (Ubuntu, RHEL, SLES vb.) ve çoklu platform, açık kaynaklı derleyiciler (GCC, LLVM vb.) Grace CPU’yu desteklemektedir.
Açık kaynaklı yazılımların büyük çoğunluğu günümüzde Arm’ı desteklemektedir. Bu nedenle, Grace CPU’da da desteklenmektedir. Benzer şekilde, Grace CPU’da yapılan yazılım optimizasyonları ve taşımaları da diğer Arm Neoverse yazılım ekosisteminde kullanılabilir.
NVIDIA, Arm ekosistemindeki geliştiricilerle ve ortaklarla çalışmalarına devam etmekte ve açık kaynaklı derleyicilerin, kütüphanelerin, çerçevelerin, araçların ve uygulamaların Arm Neoverse tabanlı CPU’lardan tam olarak faydalanmasını sağlamak için çalışmaktadır.
NVIDIA Yazılım Desteği
Arm, yıllardır teknolojinin yazılım ekosistemine büyük yatırımlar yapmaktadır. Bu sayede, yazılımlar sadece çalışmakla kalmıyor, aynı zamanda Arm için optimize edilmiştir. NVIDIA yazılım ekosistemi, hızlandırılmış hesaplama üzerindeki 40 yıllık deneyimden yararlanmaktadır ve artık Arm için optimize edilmiştir:
- NVIDIA HPC SDK ve tüm CUDA bileşenleri Arm için özgü yükleyiciler ve konteynerler sunmaktadır.
- NVIDIA’nın konteyner ekosistemi olan NVIDIA NIM mikro hizmetleri ve NGC, Arm için optimize edilmiş derin öğrenme, makine öğrenimi ve HPC konteynerleri sunmaktadır. NVIDIA NIM, yüksek verimlilik ve düşük gecikme ile AI uygulamalarında performansı artırmaktadır.
NVIDIA, Arm CPU’ları için yeni bir yüksek performans matematik kütüphaneleri seti olan NVIDIA Performance Libraries (NVPL)’yi de tanıtmıştır. Bu kütüphaneler standart API’leri uygulamakta, bu da onların x86’dan kolayca geçiş yapılmasını sağlar.
Benzer şekilde, Arm’ın Performans Kütüphanesi (ArmPL) da Grace CPU’nun performansını maksimize etmek üzere optimize edilmiştir. Arm, ArmPL Sparse’in x86 gibi kullanılabileceği konusunda bilgi paylaşmıştır.
NVIDIA, GCC ve LLVM derleyicileri gibi açık kaynak yazılım topluluklarında aktif olarak yer almaktadır. En son optimizasyonlara ulaşmak istiyorsanız, Clang dağıtımında en güncel optimizasyonlar da mevcuttur.
Yazılımınızı Arm’a Taşıma
Arm yazılım ekosistemi büyük bir biçimde büyümektedir ve yüzlerce açık kaynak proje ve ticari ISV mevcut Arm mimarisini desteklemektedir. Eğer uygulamanız henüz desteklenmiyorsa, muhtemelen yalnızca kaynak kodunu yeniden derlemeniz gerekecektir. Bu işlemi kolaylaştıracak çeşitli araçlar mevcuttur:
- NVIDIA LaunchPad, Arm’a geçiş konusunda bir modül sunmaktadır.
- Vektör iç içe geçişleri, örneğin AVX, dönüştürmeyi kolaylaştıran araçlar vardır. SIMD Everywhere ve NVIDIA Grace CPU için AI ve HPC Uygulamaları Demosu, birkaç örneği detaylandırmaktadır.
- Arm Neoverse Göç Genel Bakış, detaylı eğitim materyallerine sahiptir.
Daha fazla uygulama taşıma ve optimizasyon bilgisi için NVIDIA Grace Performans Ayar Kılavuzu’na göz atın. Bu kılavuz, Grace CPU’da performansı ayarlamak ve optimize etmek için talimatlar sunmaktadır. Ayrıca bu kılavuz Arm SIMD programlama, Arm bellek modeli ve diğer detaylar hakkında yüksek seviyede geliştirici rehberliği sağlamaktadır. Bu kılavuzu kullanarak kendi NVIDIA Grace sisteminizde en iyi performansı elde edebilirsiniz.
Sonuç
NVIDIA Grace CPU, modern veri merkezleri için 72 yüksek performanslı Arm Neoverse V2 çekirdeği, NVIDIA tasarımı yüksek bant genişliği olan SCF ile donatılmış ve yüksek bant genişliği ile düşük güç tüketimi olan bellek imkanı sunmaktadır. Bu yapı, geleneksel x86 CPU’larla aynı güç içinde %200’e kadar daha fazla performans sunmaktadır.
NVIDIA Grace CPU, standart tabanlı Arm SBSA tasarımı ile diğer CPU’larla aynı şekilde çalışmakta ve geniş Arm yazılım ekosistemi ile tamamen uyumludur.
Daha fazla bilgi için NVIDIA Grace CPU dökümanlarına göz atın.