“NVIDIA Launchables ile NVIDIA AI’nin En İyisini Tek Tıklamayla Dağıtın”

Yapay zeka geliştirme, modern yazılım mühendisliğinin temel bir parçası haline gelmiştir. NVIDIA, yapay zeka denemelerine başlamak isteyen her geliştiriciye optimize edilmiş hızlandırılmış hesaplama sunma konusunda kararlıdır.

Bunun için, NVIDIA Launchables adı verilen hızlandırılmış hesaplama yığınını daha erişilebilir hale getirmeye çalışıyoruz. Launchables, referans iş akışlarını yaygın kullanıma sunarak hemen inşa etmeye başlamanızı sağlayan yapılandırılmış GPU hesaplama ortamlarıdır.

NVIDIA Launchables Nedir?

NVIDIA Launchables, önceden belirlenmiş yapılandırmalara sahip bir tıklama ile dağıtılabilen GPU geliştirme ortamlarıdır. Bu şablonlar, ihtiyacınız olan tüm temel bileşenleri içermektedir:

NVIDIA GPU’ları
Python
CUDA
Docker konteynerleri
NVIDIA NIM, NVIDIA NeMo ve NVIDIA Omniverse gibi geliştirme çerçeveleri
SDK’lar
Bağımlılıklar
Çevre yapılandırmaları

Ayrıca, Launchables, otomatik olarak ayarlanmış ve bir GPU örneğine eklenmiş GitHub depo veya Jupyter not defterleri de içerebilir.

Launchables’ın Avantajları

Takımların projelerde iş birliği yaparken veya çoklu ortamlar arasında çalışan bireysel geliştiriciler için Launchables, manuel yapılandırma ve ek yük olmaksızın tutarlı ve yeniden üretilebilir kurulumlar sağlar:

Talep üzerine NVIDIA GPU’larına erişim: Belirli bir GPU olmadan bile bir referans iş akışını değerlendirmeye başlayabilirsiniz.
Topluluk: Başkalarının kolaylıkla dağıtabileceği bir ortam yapılandırın. Bu, demoların paylaşımı, eğitim ve referans kod örnekleriyle öğretim için faydalıdır. Yaratıcılar, bir Launchable’ın ne kadar görüntülendiği veya dağıtıldığı hakkında metrikler alır.

Launchable Örnekleri

Aşağıda, Launchables’ın nerelerde kullanışlı olduğunu gösteren bazı senaryolar bulunmaktadır:

GPU optimizasyonu için Megatron-LM kurulumunun yapılması
Çeşitli multimodal PDF veri çıkarımı için NVIDIA AI Blueprint’ın çalıştırılması
NVIDIA TensorRT-LLM ile inference için Llama3-8B’nin dağıtılması

Megatron-LM İçin GPU Optimizasyonu Kurulumu

Farklı paralellik teknikleri ile deneylere başlamadan önce, PyTorch, CUDA ve güçlü bir GPU kurulumuna ihtiyacınız vardır.

Megatron-LM Launchable’ı ile, PyTorch, CUDA ve Megatron-LM kurulumu yapılmış bir bulut ortağına ait 8xH100 GPU düğüm ortamına erişim sahibi olursunuz. Artık farklı parametreleri, örneğin --tensor-model-parallel-size ve --pipeline-model-parallel-size, ayarlayarak hangi paralellik tekniğinin model boyutunuza ve ön eğitim gereksinimlerinize en uygun olduğunu belirleyebilirsiniz.

Multimodal PDF Veri Çıkarma İçin NVIDIA AI Blueprint Çalıştırılması

Yapısal olmayan PDF kaynakları genellikle metin, tablolar, grafikler ve görüntüler içerir. Bu verilerin çıkarılması, RAG gibi yenilikçi yapay zeka uygulamaları için önemlidir.

pdf-ingest-blueprint Launchable’ı ile, işletme ortakları için bir PDF veri çıkarım hattı kurabilirsiniz. NVIDIA-Ingest mikroservisi ve diğer çeşitli NIM mikroservisleri, bu Launchable ile dağıtılarak, büyük PDF veri kümesi üzerinde belge ayırma işlemlerini paralelleştirmek için üretim kalitesinde bir pipeline oluşturabilirsiniz.

Tensorrt-LLM ile Llama3-8B’nin İnferansı İçin Dağıtım

Run Llama3 Inference with TRT-LLM Launchable’ı, düşük gecikmeli inference için TensorRT-LLM ile Llama3’ü dağıtma yöntemini gösteren bir Jupyter not defteri kılavuzu içerir. Modeli, ONNX ara temsiline dönüştürerek, optimize edilmiş plugin’ler kullanarak yapılandırma oluşturur ve TensorRT motorunu deploy ederek veri girişi üzerinde inference gerçekleştirir.

Reproduktivite Sağlayarak Daha İyi Sonuçlar Elde Etme

Erken kullanıcı geri bildirimlerini topladıktan sonra, Launchables’ın geliştirme süreçlerinde sunduğu bazı önemli teknik yetenekler bulunmaktadır:

Gerçek bir tıklamayla dağıtım
Ortam tutarlılığı
Esnek yapılandırma seçenekleri
İş birliği için tasarlanmış

Gerçek Bir Tıklamayla Dağıtım

Geliştirme ortamı kurulumları genellikle bağımlılıkları debug etmek, GPU sürücülerini yapılandırmak ve çerçevelerin uyumluluğunu test etmek için saatler sürebilir.

Launchables, önceden yapılandırılmış ortamlar sunarak bunu sadece bir tıklama sürecine indirger. Artık hemen kod yazmaya başlayabilir, altyapıyla uğraşmanıza gerek kalmaz.

Ortam Tutarlılığı

Ortam farklılıkları, yapay zeka geliştirme ekipleri için başlıca hata ayıklama nedenlerinden biridir.

Launchables, CUDA sürücülerinden çerçeve sürümlerine kadar geliştirme yığınınızı tek bir versiyona alınmasını sağlayarak bu sorunu çözmektedir. Bir Launchable URL’si paylaştığınızda, son kullanıcıların aynı geliştirme ortamını almak için garanti altına alıyorsunuz, böylece “Benim bilgisayarımda çalıştı” durumlarının önüne geçmiş oluyorsunuz.

Esnek Yapılandırma Seçenekleri

Farklı yapay zeka iş yükleri, farklı donanım ve yazılım yapılandırmaları gerektirir.

Launchables, ortamın kişiselleştirilmesine olanak tanıyarak bu durumu destekler:

VRAAM ihtiyaçlarınıza bağlı olarak belirli NVIDIA GPU’larını (T4’ten H100’e) seçin.
Özelleşmiş Python ve CUDA sürüm gereksinimlerine sahip konteyner yapılandırmalarını tanımlayın.
Belirli GitHub depolarını veya Jupyter not defterlerini, GPU örneğinizde otomatik olarak eklemek için içe aktarın.

İş Birliği İçin Tasarlanmış

Launchables, her birinin tek bir URL ile tam geliştirici ortamlarını paylaşmalarına olanak tanıyarak iş birliğini kolaylaştırır. Açık kaynak yöneticileri, eğitimciler veya dahili bir projeyi paylaşan ekip arkadaşları, kullanım metriklerini takip ederek başkalarının ortamı nasıl kullandığını anlayabilirler.

Ayrıca bu, araştırma ortamlarında yeniden üretilebilirliği sağlamak ve dağıtılmış ekipler arasında tutarlı eğitim ortamları oluşturmak için oldukça değerlidir.

Bir Launchable Oluşturma

Bir Launchable oluşturmak oldukça basittir:

Hesaplama kaynaklarınızı seçin: Çeşitli NVIDIA GPU’larından birini seçin ve kaynaklarınızı özelleştirin.
Ortamınızı yapılandırın: Belirli Python ve CUDA sürümleriyle bir sanal makine veya konteyner yapılandırmasını seçin.
Kodunuzu ekleyin: Jupyter not defterlerinizi veya GitHub depolarınızı GPU ortamınıza ekleyin.
Paylaşın ve dağıtın: Diğerlerinin hemen aynı ortamı dağıtabilmesi için paylaşılabilir bir bağlantı oluşturun.

Bunu gerçekleştirdikten sonra kazanacaklarınız:

Paylaşılabilir bir URL: Bunu başkalarıyla paylaşın veya bir YouTube video gibi bir varlık aracılığıyla paylaşın.
Bir rozet için Markdown kodu: GitHub README’sine, Jupyter defterinize entegre edebileceğiniz bir tıkladığınızda dağıtım sağlar.

URL’yi başkalarıyla paylaştıkça, toplamda kaç kez görüntülendiğine ve dağıtıldığına dair metrikleri de görüntüleyebilirsiniz.

Bugün Tek Tıklamayla Dağıtımlara Başlayın

Launchables; GPU geliştirme ortamlarını paylaşmanın ve yeniden üretmenin geleneksel zorluklarını azaltarak, tam yapılandırmaları paketleme, versiyonlama ve anında dağıtma imkanı tanır. Ekipler, altyapı kurulumlarına daha az zaman harcayarak yapay zeka uygulamaları geliştirmeye daha fazla odaklanabilirler.

NVIDIA, yeni NIM mikroservisleri ve diğer yazılımlar, SDK’lar ve kütüphaneler piyasaya sürüldükçe build.nvidia.com üzerinde daha fazla Launchables sağlamaya devam etmektedir. Hadi, bunları keşfedelim!