Agentik Yapay Zeka, yeni nesil generatif yapay zeka, otomatik karar verme yeteneği ile farklı endüstrileri devrim niteliğinde değiştirme potansiyeline sahip bir paradigmadır. Bu sistem, büyük dil modelleri (BDM’ler) ve gelişmiş akıl yürütme ve planlama yeteneklerini birleştirerek sağlık, finans, üretim ve lojistik gibi çeşitli alanlarda yeni olanaklar sunmaktadır.
Bir agentik yapay zeka sistemi, çevresiyle etkili bir şekilde etkileşime geçmek için algı, akıl yürütme ve eylem bileşenlerini bir araya getirir. Bu sistem, veritabanlarından ve harici kaynaklardan bilgi toplar, hedefleri analiz eder ve bunlara ulaşmak için stratejiler geliştirir.
Sistem, kararları uygulayan bir eylem modülü içerir ve geçmiş etkileşimlerin bellek kaydını tutarak uzun vadeli görevleri destekler ve kişiselleştirilmiş yanıtlar üretir. Ayrıca, çoklu ajan işbirliği ile ajanlar, karmaşık görevlerde bilgiyi paylaşabilir ve etkili bir şekilde koordinasyon sağlayabilir.

Yapay zeka ajanları, etkileşimleri sırasında üretilen verilerin sistemin içine geri beslenmesini sağlayarak veri döngüsü oluşturan geri besleme mekanizmaları ile donatılmıştır. Bu, sistemin zamanla operasyonel verimliliği artırmasına ve daha iyi kararlar vermesine yardımcı olur.
Bu sistemlerin temelinde, dil anlama, karar verme, akıl yürütme ve talimatları izleme gibi yetenekler sunan temel modeller yer almaktadır.
Agentik AI için Önde Gelen BDM’ler
Bugün NVIDIA, Llama Nemotron agentik yapay zeka modeli ailesini duyurdu. Bu aile, çeşitli agentik görevlerde en yüksek doğruluğu, olağanüstü hesaplama verimliliğini ve kurumsal kullanım için açık lisansı sunmaktadır. Bu yazıda, bu model ailesinin neden en yüksek doğruluğu sağladığını daha ayrıntılı bir şekilde ele alıyoruz.
NVIDIA, Arena Hard, IFEval gibi farklı benchmark’larda liderliği elinde tutan modeller geliştiriyor ve bu modelleri NVIDIA’nın uyum sağlama tekniklerini kullanarak oluşturuyor.
Agentik Yapay Zeka Sistemlerini Pazar Hızlandırması
NVIDIA, bu modellerin güçlü yönlerini bir araya getirerek yapay zeka ajanları geliştirilmesini kolaylaştırıyor. Llama Nemotron, temel agentik görevlerde olağanüstü bir performans sergileyerek, birden fazla özel modeli tek bir modelle değiştirerek mühendislik sürecini basitleştiriyor.
Bu modeller, özel verilerle kolayca özelleştirilebilir ve NVIDIA NeMo kullanılarak belirli alan ve görev gereksinimlerini karşılayacak şekilde ayarlanabilir. Ayrıca, NeMo Aligner ile insan tercihlerini izleyerek talimatlara uyan yanıtlar üretmektedir. Yapay zeka ajanlarını hızlı bir şekilde geliştirmek için NVIDIA AI Mavraları kullanılabilir.
Modeller, maksimum çıkarım verimliliği sağlamak amacıyla taşınabilir NIM mikroservisleri olarak da sunulmaktadır.
Hesaplama Verimliliği ile Optimize Edilmiş Modeller
Llama Nemotron ailesi, farklı hesaplama kaynakları için optimize edilmiştir ve çeşitli ortamlarda maksimum performans sağlamaktadır:
- Nano: NVIDIA RTX AI PC’lerde ve çalışma istasyonlarında doğruluk ve performans için optimize edilmiş bir model.
- Super: Tek bir GPU üzerinde olağanüstü bir çıktıya sahip yüksek doğruluklu bir model.
- Ultra: Veri merkezi ölçeğindeki uygulamalar için en yüksek performansı sunan yüksek doğruluklu bir model.
Agentik yapay zeka sistemleri için diğer önemli modeller şunlardır:
- Retrieval: MTEB liderliğinde sıralama alanında en hassas ve bağlamsal yanıtları sağlamak için özelleştirilmiş veri kullanarak gömme ve sıralama modelleri.
- Reward: İnsan tercihlerine uygun LLM’leri değerlendirme yeteneği sunan, RewardBench liderlik modeli llama-3.1-nemotron-70b-reward.
Yüksek Kaliteli Verilerin Toplanması
Yüksek kaliteli eğitim verisi, özelleştirilmiş BDM’lerin doğruluğu ve yanıt kalitesi açısından kritik bir rol oynamaktadır; ancak kapsamlı veri setleri oluşturmak oldukça pahalı ve zor olabilir.
Sintetik veri, bu zorlukları aşarak büyük ölçekli veri üretebilir ve kalitesini artırmak için daha fazla düzenleme yapılabilir. NVIDIA NeMo Kuratör, büyük ölçekli veri indirip, çıkarıp, temizleyip, filtreleyip ve harmanlayarak yüksek kaliteli çok modlu eğitim verisi oluşturulmasına yardımcı olur.
Son olarak piyasaya sürülen NVIDIA Llama 3.1 Nemotron 70B Instruct modeli, gerçek dünya ve sintetik veriler kullanılarak insan tercihleriyle hizalanmıştır.
Dünyanın En İyi LLM Doğruluğunu Sağlama
NVIDIA, Llama serisini ve NVIDIA’nın özelleştirme tekniklerini kullanarak, talimat izleme, araç çağırma, sohbet, kodlama ve matematik gibi çeşitli agentik yapay zeka görevleri için en yüksek doğrulukta modeller geliştirmektedir.
Bu modeller, gecikmeyi azaltmak ve hesaplama verimliliğini artırmak için budanır ve kaliteli veri setleri ile yeniden eğitilir. Bu sayede daha küçük ama yüksek doğruluk ve çıktı sağlayan modeller elde edilir.
NVIDIA’nın budama ve damıtma tekniği, nvidia/Minitron-4B-Base modeli için öğretmen model oluşturma yanlılığı içerir ve yapılandırılmış budama ve bilgi damıtma ile takip eder. Daha fazla bilgi için Llama-3.1 8B’i NVIDIA Llama-3.1-Minitron 4B Modeline Budama ve Damıtma Nasıl Yapılır başlıklı makaleye bakabilirsiniz.
NVIDIA hizalama tarifi, NeMo Aligner kullanarak modeli talimat izleme, işlev çağırma ve matematik konularında dünyanın en iyi doğruluk seviyesine getirmiştir.
Verimli LLM’ler İçin Yeni Yapı Arayışı
Agentik sistemlerin karmaşık görevleri gerçek zamanlı olarak yönetebilmesi için hesaplama verimliliği oldukça önemlidir. Ancak BDM’lerin yüksek hesaplama talepleri, optimizasyon yapılmadığı sürece bu sistemlerin kurulumunu zor hale getirebilir. Bu zorlukların üstesinden gelmek, yüksek performansı sağlarken pratik ve ölçeklenebilir dağıtım için optimize edilmiş model mimarileri geliştirmeyi gerektirir.
NVIDIA, belirli donanım platformlarında verimlilik üzerinde optimizasyon yapılmış transformer modelleri oluşturmak için Neural Architecture Search (NAS) metodolojisini ve ilgili eğitim tekniklerini geliştirip kullanmaktadır.
NAS, LLM’lerin optimize edilmiş performansını sağlamak için karmaşık yapıların yanı sıra testlerin ve çeşitli yapısal elementlerin alt yapı tasarımını keşfetme olanağı sunar:
- Alternatif dikkat mekanizmaları
- Farklı düzeyde verimlilik sağlayan çeşitli ileri besleme ağı (FFN) blokları
- Bazı yapı bileşenlerinin tamamen kaldırılması
Bu metodolojinin merkezi bileşeni olan blok damıtma, öğretmen-model yapısını kullanarak çeşitli blok varyantlarının verimli bir şekilde eğitilmesini sağlar. Öğretmen model, öğrenci blokların taklit etmesi için girdi-çıktı eşleştirmeleri sağlar.
Bulmacanın bir algoritması, alternatif mimari bileşenleri değerlendirmek ve sıralamak için kullanılır; bu süreç, tasarım alanında her yeni alt yapı parçası parçasının belirli bir çözüm önerisi olarak temsil edildiği gibi çalışır.

- Bulmaca parçalarını oluşturmak: Her alternatif güneşlik değişiminde blok bazlı yerel damıtma uygulamak ve kaliteli ve çıkarım maliyetini puanlamak için parçaların kütüphanesini oluşturmak.
- Bulmaca mimarisini bir araya getirmek: Çıktı süresi, gecikme ve bellek kullanımı gibi kısıtlamalar altında kaliteyi optimize eden karmaşık mimari oluşturmak için karmaşık tamsayı programlaması kullanmak.
- Yeniden eğitmek: Yeniden birleştirilen mimari, bloklar arası uyumluluğu güçlendirmek için küresel bilgi damıtma ile eğitilmektedir.
Bilgi damıtma kaybını, hem sıralama hem de eğitim sırasında dahil ederek, metodoloji ile optimize edilmiş modellerin referans karşıtları arasında doğruluk farkını azaltmaktadır.
NVIDIA NeMo Aligner ile yapılan bir dizi ileri ince ayar adımı, elde edilen modellerin insan tercihleriyle uyumlu yanıtlar üretmesini sağlar ve bu modeller hedef NVIDIA GPU’larda önemli çıkarım verimliliği hızlandırmaları sunmaktadır.
NeMo Aligner, insan geri bildirimlerinden öğrenmek (RLHF), doğrudan tercih optimizasyonu (DPO) ve SteerLM gibi en iyi algoritmaları içeren ölçeklenebilir ve verimli bir model hizalama toolkitidir.
Sonuç olarak, Llama Nemotron Super ve Llama Nemotron Ultra modellerinin geliştirilmesine olanak tanımaktadır.
Açık BDM’ler
Llama Nemotron modelleri, özelleştirilmesine ve işletmelerin veri kontrolünü elinde tutarak ihtiyaçlarına göre ayarlanmasına imkan tanıyan ticari olarak geçerli bir çözüm sunan açık kaynak lisansı ile desteklenmektedir.
Açık lisans, bu güçlü modellerin on-premises, bulut veya kenar cihazlarda uygulanabilmesi için gereken esnekliği sağlayarak işletmelerin Llama Nemotron’un avantajlarından yararlanmasını sağlar.
Başlangıca Giden Yol
Agentik yapay zekanın planlayabilen, düşünebilen ve eyleme geçebilen özel AI ajanlarının geliştirilmesini ve dağıtımını basitleştirin. Yeni NVIDIA AI Mavraları ile başlayın.
Yeni Llama Nemotron modelleri hakkında bildirim almak için kayıt olun. Bu modeller, NVIDIA NGC ve Hugging Face üzerinden indirilebilir ve NVIDIA NeMo ile özelleştirilebilir.