NVIDIA Grace CPU, Dünya Çapında Veri Merkezi Performansı ve Çığır Açan Enerji Verimliliği Sunuyor

NVIDIA, NVIDIA Grace CPU’yu, veri merkezi ölçeğinde olağanüstü enerji verimliliği sunan ve performans için optimize edilmiş yüksek performanslı bir CPU olarak tasarladı.

Hızlandırılmış hesaplama yöntemleri, geleneksel CPU hesaplamalarına kıyasla büyük performans ve enerji verimliliği artışları sağlıyor. Bu hız artışlarını elde etmek için, çiplerden sistemlere, yazılımlardan algoritmalara kadar uzanan kapsamlı yenilikler gereklidir. İş yükleri için doğru mimarinin seçilmesi, veri merkezinin performansını en üst düzeye çıkarmak ve fiziksel alanı minimize etmek açısından oldukça önemlidir.

Giderek hızlanan iş yüklerinin yanında, günümüzde hala geleneksel CPU’lar üzerinde çalışan çok sayıda uygulama var; özellikle seyrek ve “dalgalı” serileştirilmiş görevler, örneğin grafik analitiği gibi. Aynı zamanda, veri merkezleri giderek daha fazla enerji kısıtlaması yaşıyor ve bu durum, kapasitelerini artırma yeteneklerini sınırlıyor. Bu nedenle, hızlandırılabilecek tüm iş yüklerinin hızlandırılması gerekiyor. Hızlandırılamayanlar için ise en verimli hesaplama birimi kullanılmalı ve CPU, bu iş yükleri için optimize edilmelidir.

Enerji Verimliliği ve Performansta Üstünlük

Yeni enerji verimli Grace CPU, mükemmel tek iş parçacığı performansı gerektiriyor ve birçok uygulamanın eşzamanlı olarak çalışabilmesi için yeterli çekirdek sayısına sahip olmalıdır. Her bir çekirdek, yüksek CPU çekirdek verimliliği sağlamak ve hızlı iletişim için önemli bellek bant genişliğine ihtiyaç duyar.

NVIDIA Grace mimarisi, GPU’ların ve uyumlu şekilde birleştirilmiş CPU-GPU mimarilerinin hızlı bir şekilde veri merkezini hızlandırdığı bir dünyaya göre tasarlanmıştır. Böyle bir mimarinin, olağanüstü tek iş parçacığı performansı, hızlı bir yapı, dikkat çekici enerji verimliliği ve yüksek bellek bant genişliği sunan bir CPU gerektirmesi gerekiyor.

Grace CPU, 72 yüksek performanslı ve enerji verimli Arm Neoverse V2 çekirdeği ile birleşerek NVIDIA Ölçeklenebilir Koherensi Fabrikası (SCF) ile bağlantılıdır. NVIDIA SCF, toplamda 3.2 TB/sn’lik kesişim bant genişliği sağlayan yüksek bant genişliğine sahip bir çip içi yapıdır; bu, geleneksel CPU’ların sunduğu teknolojinin iki katına eşdeğerdir. Yüksek bant genişliğine sahip çip içi bir yapı, CPU çekirdekleri, ön bellek, bellek ve sistem girişi/çıkışı arasındaki veri akışını sürdürülebilir kılarak maksimum sistem düzeyi performansı sağlar.

Yüksek Hızlı Bellek ile Destekleniyor

Grace, yüksek hızlı LPDDR5X belleği kullanan ve hata düzeltme kodu (ECC) gibi sunucu sınıfı güvenilirlik mekanizmaları ile geliştirilen ilk veri merkezi CPU’dur. Bu daha verimli bellek türünü ve geniş bir bellek alt sistemini kullanması sayesinde, Grace, yalnızca geleneksel DDR belleğin beşte birini tüketerek, 500 GB/sn’ye kadar bellek bant genişliği sunmaktadır.

Bunların yanı sıra, NVIDIA Grace CPU Superchip, olağanüstü performans, bellek bant genişliği ve veri hareket kabiliyeti sağlıyor ve bu, watt başına devrim niteliğinde bir performans getiriyor. Veri merkezi düzeyinde bu, performansta nesil sıçramasına ve toplam sahip olma maliyetinin (TCO) iyileşmesine dönüşüyor. Grace mimarisi, mikro hizmetler, veri analitiği, grafik analitiği ve simülasyon gibi geniş bir temel veri merkezi iş yükü yelpazesine uygun, genel amaçlı bir CPU sunuyor.

The chart compares the NVIDIA Grace CPU Superchip with the Intel Xeon 8480+ and AMD EPYC 9654 2S servers across a range of application based workloads with NVIDIA Grace leading by up to 2x.
Şekil 1. NVIDIA Grace CPU Superchip’in, Intel Xeon 8480+ ve AMD EPYC 9654 2S sunucuları ile performans karşılaştırması

Şekil 1, NVIDIA Grace mimarisi ile önde gelen x86 sunucuları arasındaki ham performansı karşılaştırıyor ve Grace’nin x86 rakiplerine karşı sunucu seviyesinde öncü performans sunduğunu gözler önüne seriyor.

Uygulama Türlerinde Mükemmel Performans

Grace mimarisinin olağanüstü bellek bant genişliği ve yapı performansı, popüler uygulama türleri arasında güçlü bir performans sunmasını sağlıyor. Bu uygulamalardan bazıları şunlardır:

  • Mikro hizmetler: Veri merkezlerinin kolayca ölçeklendirilmesine imkân tanıyan küçük, bağımsız hizmetlerdir. Google protokol tamponları yükü, mikro hizmetler arasında verilerin ne kadar hızlı serileştirilebileceğini ölçmektedir.
  • Yüksek performanslı hesaplama (HPC) ve veri analitiği: Hava durumu tahmini gibi iş yükleri, ulaşılabilir bellek bant genişliğine oldukça duyarlıdır. En iyi bellek bant genişliği ve hızlı NVIDIA tasarımıyla Donatılan yapı sayesinde, Grace bu tür benchmark’larda en iyi performansı sağlamaktadır.
  • Grafik analitiği: Finansal hizmetlerde, sağlıkta ve birçok sektördeki pazarlama ve operasyonlari için optimizasyon algoritmalarının bir parçası olarak yaygın olarak kullanılır. GapBS Genişlik Önceliği Arama benchmark’ında, Grace geleneksel x86 CPU’ların iki katı yapı bant genişliği ile dikkat çekmektedir.

Sıkıştırma gibi çekirdek sayısıyla iyi ölçeklenebilen iş yüklerinde, Grace yüksek performanslı çekirdekleri ve yüksek bant genişliğindeki NVIDIA SCF ile benzer performans gösterebilmektedir.

Şekil 2. NVIDIA Grace CPU Superchip enerji verimliliği karşılaştırması

NVIDIA Grace Superchip 480GB LPDDR5X, AMD EPYC 9654 768 GB DDR5, ve Intel Xeon Platinum 8480+ ile 1TB DDR5. İşletim Sistemi: Ubuntu 22.04, Derleyiciler: GCC 12.3 (açıklandı). Enerji verimliliği ölçümlerinde CPU + bellek ölçülen güç dahil edilmiştir.

Sıkıştırma: Snappy, Mikro hizmetler: Google Protobufs, HPC SDK 24.3 CFD: OpenFOAM Motorbike; Hava Durumu: WRF CONUS12km x86: ICC 2024.01; Veri Analitiği: HiBench+K-means Spark; Grafik Analitiği: Gap Benchmarks Suite BFS.

Kesintisiz Performans Sağlıyor

Olağanüstü performans ve enerji verimliliğinin ötesinde, Grace CPU, kesintisiz performans sağlamak hedefiyle tasarlanmıştır. Maximum frekansı, tüm çekirdekler aktif olduğunda bile koruyabiliyor ve enerji kısıtlamaları altında dahi yüksek performans düzeyini sürdürebiliyor.

NVIDIA SCF, veri akışında yaşanan darboğazları ortadan kaldırıyor. Yüksek bant genişliği yapısı ve geniş LPDDR5X bellek arayüzü sayesinde, Grace CPU, tüm çekirdekler aktif olduğunda bile %90’ın üzerinde STREAM verimliliğine (maksimum bant genişliğine karşı verilen bellek bant genişliği oranı) ulaşmaktadır. Rakip sistemler ise %80’in üzerinde maksimum verimlilik sağlarken, tüm çekirdekler aktif olduğunda bu oran %70’e kadar düşebilmektedir.

Şekil 3. NVIDIA Grace CPU, maksimum bant genişliği ile tüm çekirdekler aktifken sabit STREAM bant genişliği sunuyor

Rekabetçi karşılaştırmalar AMD EPYC 9004 Serisi İşlemcileri için Yüksek Performans Ayarlama Kılavuzu‘na dayanmaktadır.

Şekil 4. NVIDIA Grace CPU Superchip, maksimum bant genişliği ve tüm çekirdekler aktifken %90’ın üzerinde STREAM verimliliği sağlıyor.

Veri Merkezinde Eşsiz Performans Seviyesi

Bugünün Moore Yasası sonrası döneminde, geleneksel CPU yöntemleri, artan hesaplama performansı talebini karşılamak için orantısız maliyet ve enerji artışları gerektiriyor. Veri merkezleri, güç teslimatı açısından kısıtlı hale geliyor ve bu durum, kapasitelerinin büyümesini sınırlıyor. Bu zorluklarla başa çıkmak ve sürdürülebilir bilişim hedeflerini güçlendirmek için, modern veri merkezleri tüm iş yüklerini hızlandırmalıdır. Hızlandırılamayan iş yükleri için en enerji verimli hesaplama birimi kullanılmalıdır.

NVIDIA Grace, aynı güç tüketimi içinde iki kat performans sunma yeteneği ile bu zorlukları karşılıyor. Veri merkezi yöneticileri, mevcut güç bütçesi içinde performansı artırmanın yanı sıra, yalnızca yarım enerji tüketimi ile maksimum performansı koruma seçeneklerine sahip. Böylece, bu güç tasarrufları, sınırlı güç bütçesindeki GPU’larla hızlandırmayı artırmak için kullanılabilir.

NVIDIA Grace, Arm standartları kullanılarak üretilmiştir. Bu sayede, başka Arm veri merkezi sınıfı mimarilerine geçiş yapılırken yapılan tüm çalışmalar, Grace üzerinde çalışacak; Grace’de gerçekleştirilen çalışmalar da Arm veri merkezi ekosisteminin geri kalanıyla uyumlu olacaktır. Ayrıca Grace, NVIDIA GB200 Grace Blackwell Superchip gibi ürünler ile CPU ve GPU mimarilerinin birleşimini kolaylaştırmaktadır. Grace ile veri merkezleri, tüm Arm ekosisteminde çalışacak tek bir CPU mimarisi üzerinde standartlaşma imkânı bulmaktadır.

Harekete geçmeye hazır mısınız? Ücretsiz NVIDIA Grace CPU laboratuvarında deneyimi yaşamak için NVIDIA LaunchPad’ı kullanabilirsiniz.

Kaynak

Nvdia Blog

Exit mobile version