SON DAKİKA

Nvdia

NVIDIA H200 Tensor Core GPU ile Hesaplamalı Akışkanlar Dinamiğini Geliştirmenin Yolları

Hesaplamalı akışkanlar dinamiği (CFD), sanayi ve akademide birçok farklı kullanım alanını kapsamakta; bu alanlar arasında dış aerodinamik, iç akışlar, ısı transferi, yanma, tepkime akışları, serbest yüzey akışları, çok fazlı akışlar ve aero-akustiği sayabiliriz.

CFD çözücüleri genellikle dış aerodinamik simülasyonlarında kullanılmakta; bu simülasyonlar, sürtünmeyi azaltarak ve yakıt verimliliğini artırarak ulaşım araçlarındaki emisyonların düşürülmesine yardımcı olmaktadır. Bazı çözücüler ise yanma veya tepkime akışlarını destekleyerek sistemlerdeki atık ve emisyonların azaltılmasına katkıda bulunur.

Bu akışkan akışı problemlerinin hesaplamalı çözümlerinin zorluğu, zaman ve uzunluk ölçeklerinin genişliğinden kaynaklanmaktadır. Endüstriyel ölçekli projelerde, akış senaryolarının tasarım ve test aşamalarında zamanında sonuçlar alabilmek için büyük yüksek performanslı bilişim (HPC) kaynaklarından yararlanmak gerekmektedir. HPC kaynakları kullanılsa bile, mühendisler modelleri basitleştirmek zorunda kalmakta; bu da de-featuring ve akış yaklaşımlarının kullanılmasını gerektirmektedir.

Hızlandırılmış Bilişim Devrimi

GPU’ların hızlandırılmış işlem kapasiteleri, kuantum bilişim, iklim bilimi, finans mühendisliği ve yapay zeka gibi düzlemlerde yeni ufuklar açmıştır. Bu geniş kapsamlı uygulamalar, işletmelerin CPU’ya dayalı işlemeyle kıyaslandığında 1 kat daha hızlı işlem yapmasına olanak tanımaktadır.

CFD, NVIDIA GPU’larının hızlandırılmış işlem yeteneklerinden en çok faydalanan alanlardan biridir; geleneksel CPU tabanlı hesaplamalarla karşılaştırıldığında, %30’dan fazla hız kazancı sağlanabilmektedir. Daha fazla bilgi için GPU’ların Ansys Fluent İçin Tam Gücünü Ortaya Çıkarma yazısını ziyaret edebilirsiniz.

NVIDIA H200 Tensor Core GPU Neden CFD İçin Oyun Değiştirici?

CFD yüklemelerini GPU’larda çalıştırmak yeni bir kavram değil, peki H200 GPU’yu bu kadar iyi bir seçenek yapan nedir?

Birinci öncelik, CPU’larla paylaşılan mevcut bellek miktarıdır. Ne kadar fazla bellek varsa, o kadar büyük işler gerçekleştirilebilir. Çalıştırılması planlanan tüm GPU’larda yeterli bellek bulunmalıdır.

Önceki nesil GPU’lar (A100, H100) 80 GB bellek kapasitesine sahipti. H200 GPU ise 141 GB bellek sunarak çok daha büyük işlemleri gerçekleştirmeye olanak tanımaktadır. Gerekli bellek miktarı, ağ boyutu, çözücüler ve seçilen fizik türüne bağlıdır. Tek fazlı, ayrılışlı senaryolar için genel bir kural, her 1 GB GPU belleği başına 1.2M hücre olduğu yönündedir. Dolayısıyla, 80 GB’lık bir GPU yaklaşık 90M hücrelik bir durumu çalıştırırken, H200 GPU yaklaşık 160M hücrelik durumları çalıştırabilir.

Bir diğer önemli faktör, hesaplama performansındaki sınırlayıcı unsurlardır. Bu sınırlayıcılar genel olarak bellek bant genişliği ve hesaplama oranı olarak sınıflandırılabilir. Birçok sonlu hacim CFD kodunda bellek bant genişliğinin sınırlayıcı faktör olduğu görülmektedir. Bellek bant genişliğini artırmak, doğrudan çözüm sürelerinin kısalmasıyla ilişkilidir.

Aşağıdaki Tablo 1, en güncel veri merkezi GPU’larının spesifikasyonlarını göstermektedir. Bu GPU’lar, en yüksek performanslı yüksek bant genişlikli belleği (HBM) kullandıkları için seçilmiştir. Tablo, bu GPU’ların bellek ve bellek bant genişliğini karşılaştırmaktadır. H200 GPU, 80 GB A100 GPU’ya kıyasla 2 katından fazla bellek bant genişliğine sahiptir. A100’den H200’e geçiş yaptığınızda performansın yaklaşık 2 kat artmasını bekleyebilirsiniz.

GPU (SXM) Bellek (GB) Bellek Bant Genişliği (TB/s)
A100 80 (HBM2e) 2.0
H100 80 (HBM3) 3.35
H200 141 (HBM3e) 4.8
Tablo 1. NVIDIA Ampere ve NVIDIA Hopper nesli veri merkezi GPU’ları için bellek ve bellek bant genişliği karşılaştırması

Ansys Fluent Sonuçları

NVIDIA H200 Tensor Core GPU’nun performansını göstermek amacıyla, Ansys ile iş birliği yaparak endüstri standardı Ansys Fluent CFD çözücüsünün performansını sergilemek için bir çalışma gerçekleştirdik. Ansys, tamamen hızlandırılmış bir yerel GPU çözücüsü geliştirmiştir ve bu da önemli hız artışları sağlamıştır.

GPU ve CPU Performansı

Şekil 1, Ansys Fluent’i NVIDIA GPU’ları üzerinde çalıştırmanın etkileyici performansını göstermektedir. Mavi çizgi, CPU üzerinde 4 ile 96 düğüm arasında (512’den 12288 çekirdeğe kadar) değişen sonuçları göstermektedir.

A graph shows the higher performance of GPU compared to CPU. Eight H200 GPUs are 34x faster than four CPU nodes with 512 cores.
Şekil 1. Sekiz H200 GPU ile önemli performans iyileştirmeleri (kaynak: Ansys)

Sonuçlar, sekiz H200 GPU’nun 512 çekirdeğe sahip olan dört CPU düğümünden 34 kat daha hızlı olduğunu göstermektedir. Doksan altı CPU düğümü, sekiz H200 GPU’nun performansını yakalayamamaktadır; H200, halen 1.9 kat daha hızlıdır. Bu performans sayesinde, geçici ve ölçek çözümlü durumların GPU üzerinde gerçekleştirilmesi, saatler içinde tamamlanabilmektedir. Bu tür durumlar daha önce haftalar sürebiliyordu.

Nesil GPU Performans İyileştirmesi

Şekil 2, 250M hücreli DrivAer model durumu için bir dizi GPU üzerinde aynı performansı göstermektedir. Sekiz H200 GPU, sekiz A100 GPU’dan 1.9 kat daha hızlıdır; bu da NVIDIA Ampere ve NVIDIA Hopper nesli Tensor Core GPU’ları arasındaki performans iyileşmesini göstermektedir.

A graph shows performance improvement with H200 GPUs 1.9x faster than A100.
Şekil 2. A100 ve H200 Tensor Core GPU’ları arasındaki nesil iyileşmesi (kaynak: Ansys)

CFD Daha Yüksek Performans ve Fidelite ile

NVIDIA H200 Tensor Core GPU, 140 GB HBM3e bellek ve 4.8 TB/s bellek bant genişliğine sahip olması sayesinde CFD performansında bir atılım temsil etmektedir. Bu, daha büyük ve yüksek fideliteye sahip modellerin daha az sayıda GPU ile daha hızlı çalıştırılmasını olanaklı kılmaktadır.

Ansys Fluent ile sağlanan sonuçlar, CPU ve rakip GPU tekliflerinden önemli ölçüde daha hızlı bir performans sergilemektedir. Bu avantajlar, daha yüksek fideliteyle daha fazla tasarım döngüsünü simüle etmenizi sağlar ve nihayetinde daha iyi ürün performansına yol açar.

Dijital mühendisliğin yeni bir çağını hızlandırmak için Ansys ve NVIDIA nasıl bir iş birliği yaptıkları hakkında daha fazla bilgi için NVIDIA ve Ansys İş Ortaklığı için Endüstriyel Çözümler sayfasını ziyaret edebilirsiniz.

Kaynak

Nvdia Blog

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri