CUDA Toolkit 13.0 ile Yenilikler ve Geliştirmeler
En yeni güncelleme olan CUDA Toolkit 13.0, NVIDIA’nın en son CPU ve GPU’larında hesaplamaları hızlandırmak için önemli yenilikler sunuyor. Bu büyük sürüm, gelecekteki tüm CUDA 13.X yazılım serisine zemin hazırlıyor. Bu yeni özelliklere hemen erişebilirsiniz.
Bu yazıda, bu sürümle birlikte gelen bazı yeni özellikler ve geliştirmeler vurgulanmaktadır:
- Tabanlı programlama için CUDA temeli oluşturulması
- DGX Spark’ta Arm platformları için geliştirici deneyiminin birleştirilmesi
- Red Hat Enterprise Linux 10 dahil olmak üzere güncellenmiş işletim sistemi ve platform desteği
- NVIDIA Nsight Geliştirici Araçları güncellemeleri
- Matematik kütüphanelerindeki lineer cebir ve FFT güncellemeleri
- GCC 15 ve Clang 20 destekli NVCC Derleyici güncellemeleri
- Hızlandırılmış Python
cuda.core
sürümü ve geliştirici dostu paketleme - Özellik açısından tam mimariler
- Blackwell için artırılmış performans ile güncellenmiş vektör tipleri
- Jetson Thor desteği
Blackwell GPU’ları ve CUDA 13.0 Desteği
Blackwell mimarisi, CUDA Toolkit 12.8 ile desteklenmeye başlamıştı ve 13.0 ile birlikte performans ve yeteneklerde önemli iyileştirmeler sunuyor. CUDA 13.0, aşağıdaki en son Blackwell GPU’larını desteklemektedir:
- B200 ve GB200
- B300 ve GB300
- RTX PRO Blackwell serisi
- RTX 5000 serisi (GeForce)
- Jetson Thor
- DGX Spark
Tabanlı Programlama Modeli
Her yeni CUDA sürümü, performans artışları ve tüm yelpazedeki programlamayı geliştirmektedir. CUDA, başından itibaren tek Talimat, Çoklu İplik (SIMT) modelini benimsedi. Ancak CUDA 13.0 ile, tamamlayıcı bir ikinci model olan tabanlı programlama için zemin hazırlıyoruz.
Taban (dizi) programlama modelleri, Python gibi yüksek düzey dillerde yaygın olarak kullanılmaktadır. NumPy ile çalışırken, tüm dizilere veya matrislere basit ve anlaşılır komutlar uygulayabilir, sistem düşük seviyeli yürütmeyi üstlenir. Bu soyutlama, sizlere yalnızca ne yapacağınızı düşünme imkânı tanır; düşük seviyeli iplik ayrıntılarıyla yönetmek zorunda kalmazsınız, bu da performanslı algoritmalar tasarlamanızı kolaylaştırır.
NVIDIA, 2025 GTC’de bu taban programlama modelini CUDA’ya getirmeyi planladığını duyurdu. Bu, geliştirici verimliliği ve donanım verimliliği için önemli bir adımdır.
Arm İçin CUDA’nın Birleştirilmesi: Tek Bir Kurulum ile Her Yerde Dağıtım
CUDA 13.0 ile, NVIDIA, Arm platformlarında geliştirmeyi düzene sokarak, sunucu sınıfı ve gömülü cihazlar arasında CUDA araç setini birleştiriyor. Artık, Server Base System Architecture (SBSA) uyumlu sunucular ve Thor gibi gelecek nesil gömülü sistemler için ayrı kurulumlar veya araç zincirleri sürdürmeniz gerekmeyecek. Tek bir CUDA kurulumuyla tüm Arm hedeflerini destekleyebileceksiniz; şu an için yalnızca Orin (sm_87), mevcut yolu izlemeye devam edecektir.
Bu değişim, büyük bir verimlilik kazancı sağlıyor. Artık bir robotik veya AI uygulamasını bir kez kurabilir, yüksek performanslı sistemlerde (DGX Spark gibi) simüle edebilir ve tam olarak aynı ikiliyi—kod değişikliği yapmadan—gömülü hedefler gibi Thor’a doğrudan dağıtabilirsiniz. Simülasyon ile dağıtım arasındaki engeller ortadan kalkıyor.
Geliştirici Araçları ve Matematik Kütüphanelerindeki Gelişmeler
NVIDIA Nsight Compute 2025.3, kaynak görünümüne Talimat Karışımı ve Skorbaord Bağımlılık tablolarını ekliyor. Bu, kullanıcıların uzun bağımlılık gecikmelerinden etkilenen kaynak satırlarını belirlemelerini ve bağımlılıkları daha verimli bir şekilde tanımlamalarını sağlıyor.
Ayrıca, Verimlilik Kırılımı bölümü, belirli birimlerin verimlilik metriklerini gösteriyor. Bu birimlerin herhangi biri verimlilikte sınırlayıcı bir faktör olabiliyor ve bu pencere, her birinin nasıl performans gösterdiğini anlamanıza yardımcı oluyor.
CUDA Toolkit matematik kütüphanelerinde de yeni özellikler eklenmiştir:
- cuBLAS: Blackwell GPU’ları üzerinde FP32 ve CF32 hassasiyetleri için BLAS L3 (non-GEMM) çekirdekleri için iyileştirilmiş performans.
- cuSPARSE: SpGEMM hesaplamalarında 64-bit indeks matrislerini destekliyor.
- cuSOLVER: Blackwell GPU’larında iyileştirilmiş FP32 aritmetiğini kullanarak yeni bir matematik modu sunuyor.
- cuFFT: Tek hassasiyetli C2C çok boyutlu FFT’ler ve bazı büyük ikili FFT’ler için geliştirilmiş performans sunuyor.
CUDA 13.0 ile NVCC Derleyici Güncellemeleri
Yeni derleyici güncellemeleri arasında GCC 15 ve Clang 20 gibi host tarafı derleyicileri için destek ile ICC ve MSVC 2017 desteğinin kaldırılması yer alıyor. Ayrıca, NVCC için bazı önemli değişiklikler yapılmıştır.
CUDA Toolkit 13.0, artık ZStandard (ZStd) üzerine kurulu bir sıkıştırma şemasını varsayılan olarak belirler. Bu güncelleme, daha iyi sıkıştırma oranları sağlayarak eski LZ4 tabanlı sıkıştırma yöntemine kıyasla daha etkili olmaktadır.
CUDA 13.0, cuda.core
adlı bir bileşenle Python’a özel erişim imkânı sunar. Bu, geliştiricilerin CUDA’nın temel işlevlerine daha kullanıcı dostu bir şekilde erişim sağlamasını kolaylaştırır.
Jetson ve Geliştirmeler
CUDA 13.0, Jetson platformları için açık kaynaklı bir GPU sürücüsü desteği sunmaktadır. Bu, entegre GPU’lar ile ayrık GPU’ların gelecekte eşzamanlı kullanımını sağlamaktadır, bu da daha verimli bir bilgi işlem deneyimi sunar.
CUDA 13.0 ile birlikte, Thor tabanlı Jetson platformları, Birleşik Sanal Bellek (UVM) ve tam tutarlılık desteği sunmaktadır. Bu, sistem tarafından tahsis edilen belleğin GPU tarafından doğrudan kullanılmasını sağlar.
Ayrıca, Jetson’a Yeşil bağlamlar getirilmiştir. Bu bağlamlar, kaynakların önceden tahsis edilmesiyle daha tahmin edilebilir bir işlem süreci sağlar.
CUDA 13.0 ile gelen tüm bu gelişmeler, CUDA belgelerini, NVIDIA Derin Öğrenme Enstitüsü (DLI) kurslarını ve NGC kataloğunu keşfetmeniz için sizi davet ediyoruz. Sorularınızı CUDA Geliştirici Forumları‘nda sorabilirsiniz.
Son Söz
CUDA Toolkit 13.0, yeni bir tabanlı programlama modeli sunarak geliştirici verimliliğini ve performansını artırmaktadır. Bu sürüm, en son NVIDIA GPU’ları için iyileştirilmiş kütüphaneler, derleyiciler ve geliştirme araçlarıyla doludur.