Ajanslar, büyük dil modellerini (BDM’ler) karmaşık problemleri çözmek için uygulamanın başlıca sürücüleridir. 2023’teki AutoGPT‘nin çıkışından bu yana, çeşitli teknikler, farklı endüstrilerde güvenilir ajanslar inşa etmek için geliştirilmiştir. Ajansik akıl yürütme ve yapay zeka akıl yürütme modelleri etrafındaki tartışmalar, bu uygulamaların tasarımına daha fazla derinlik katmaktadır. Ayrıca, bu gelişmelerin hızlı temposu, geliştiricilerin bu ajansları oluşturma yolunda birçok tasarım ve teknik seçeneği arasından seçim yapmalarını zorlaştırmaktadır.
Bu kararları basitleştirmek adına, bu yazıda şu geniş konular ele alınacaktır:
- BDM ajansı nedir ve hangi yapısal kalıplar dikkate alınmalıdır?
- BDM akıl yürütmesi ve test zamanı ölçeklendirmesi nasıl çalışır?
- Düşünülmesi gereken farklı akıl yürütme türleri nelerdir?
BDM Ajansı Nedir?
BDM ajansları, karmaşık bir problemi çözmek için bir BDM kullanarak akıl yürütme yapar, bir plan oluşturur ve bir görevi tamamlamak için araçlar veya API’ler kullanır. Bu, onları akıllı sohbet robotları, otomatik kod üretimi ve iş akışı otomasyonu gibi üretken yapay zeka kullanım durumları için mükemmel hale getirir. BDM ajansları, daha geniş yapay zeka ajansı manzarasının sadece bir kesitidir: ajansik yapay zeka terimi ayrıca, bilgisayarla görme modelleri, konuşma modelleri ve pekiştirmeli öğrenme ile çalışan ajansları da kapsar ve bunlar müşteri hizmetleri sohbet robotlarından karmaşık kurumsal süreç orkestrasyonuna veya kendi kendine giden arabalara kadar her şeyde yer alır.
Uygulama alanlarına göre, BDM ajansları temel olarak sohbet robotları ve iş akışları olarak ikiye ayrılabilir. Eğer ajanslarla yeni tanışıyorsanız, bu makale, ilk ajansınızı inşa ederek kavramsal parçaları öğrenmenize yardımcı olacaktır!
İş Akışları
Robotic Process Automation (RPA) boru hatları, genellikle veri girişi, talep dosyalama ve müşteri ilişkileri yönetimi (CRM) gibi mekanik görevleri otomatikleştirmek için kullanılır. Bu sistemler, genellikle arka planda çalışan çevrimdışı parti işlerini çözmek üzere tasarlanmıştır.
Bu sistemler, genellikle katı kurallar ve sezgisel süreçler etrafında tasarlanmıştır. Bu durum, RPA boru hatlarının uygulama alanını kısıtlar ve genellikle ölçeklenebilir olmalarıyla ilgili sorunlara yol açar.
BDM’ler sayesinde, bu ajans boru hatları, karmaşık kararlar alabilme ve problemi çözmek için uygun araçları kullanma yeteneği ile esnek hale getirilebilir.
BDM ajanslarının RPA boru hatlarını devrim niteliğinde değiştirebileceği bir kullanım durumu, sigorta ve sağlık hizmetleri endüstrilerinde talep işleme olabilir. Geleneksel RPA boru hatları, veri yapısında katı olduğundan, BDM ajansları, müşteri yüklemeleri gibi farklı belge biçimlerinden gelen karmaşık verileri işleyebilirler.
Ajanslar ayrıca talebe dayalı dinamik iş akışları geliştirebilir, potansiyel dolandırıcılık tespitinde yardımcı olabilir, değişen düzenlemelere bağlı olarak karar verme süreçlerini ayarlayabilir veya karmaşık talep senaryolarını analiz ederek, poliçe ve geçmiş verilere dayanarak uygun eylemleri önerirken yardımcı olabilir.
Bir iş akışında, ajanslar, karmaşık bir görevi, esas olarak iş mantığı tarafından belirlenen kesin sınırlı yollara bölerek tanımlanan bir önceden belirlenmiş boru hattında çalışır. Bu durumlarda, BDM’ler her alt görevin belirsizliğini gidermek için kullanılır ancak üst düzey görev akışı önceden belirlenmiştir.
Şekil 1, nakledilen konteynerlerdeki zafiyetleri tespit etmeye yardımcı olan bir CVE analiz iş akışının bir örneğini göstermektedir. Bu boru hattı iyi tanımlanmış olup kesin, özgül alt görevlerden oluşmaktadır.
Sohbet Robotları
Ajansların bir diğer kullanım durumu, yapay zeka sohbet robotlarıdır. Yanıt gecikmesine ve çözdükleri görevin doğasına bağlı olarak, bu sohbet robotları şu şekilde kategorize edilir:
- Keşif Ajansları
- Destekleyici Ajanslar
Keşif ajansları, genellikle karmaşık çok adımlı görevleri çözmek üzere tasarlanmış ajanslardır ve bu görevler zorlayıcıdır ve ajansın uygulanması zaman alır. Bu ajanslar, kullanıcıların görevler verdiği bağımsız ajanslar olarak düşünülebilir.
Harika bir örnek, OpenAI ve Perplexity’nin Deep Research‘üdür. Bu ajanslar karmaşık çok adımlı bir problemi akıl yürütme yoluyla çözer ve nihai bir çözüm bulmaya çalışır. Bu durumlarda kullanıcılar, yinelemeli etkileşimlerden ziyade bağımsız bir tamamlanma beklerler.
Destekleyici ajanslar, temelde kullanıcıların karar verme sürecine dahil olduğu işbirlikçi bir insan-döngüsü deneyimi gerektirir. Bu ajanslar, genellikle dar bir araç setini kullanarak tasarlanır.
Örneğin, bu uygulamalar belge yazım asistanları, kişisel yapay zeka asistanları, vergi beyannamesi asistanları gibi olabilir. Bu ajanslar, daha az gecikme ile daha küçük, çoğu zaman tekrar eden sorunları çözmek üzere inşa edilmiştir.
Tüm bu ajanslar, bir görevi çözme planı oluşturarak ve bazı araçların yardımıyla akıl yürütme gerektirir (Şekil 3).
BDM Akıl Yürütmesi Nedir?
Oxford Sözlüğü akıl yürütmeyi, “bir şeyi mantıklı ve akla yatkın bir şekilde düşünme eylemi” olarak tanımlar. Bu tanım, BDM’ler ile akıl yürütme paradigmasını düşünürken oldukça uygundur.
Son birkaç yılda, Planla ve Uygula, BDM derleyici ve Dil Ajansı Ağaç Arama gibi birçok akıl yürütme çerçevesi gelişmiştir ve DeepSeek-R1 gibi akıl yürütme modelleri de ortaya çıkmıştır. Şimdi sorulması gereken, bu gelişmeleri nasıl bağlamlandırıp holistik bir görüş elde edebileceğimizdir.
Bu bağlamda akıl yürütme, geniş hatlarıyla aşağıdaki kategorilere ayrılabilir:
- Uzun Düşünme
- En İyi Çözümü Arama
- Düşün, Eleştir, İyileştir
Bütün bu teknikler, test zamanı hesaplamasını ölçeklendirme ile çalışarak, yanıtların kalitesini artırmakta ve daha karmaşık problemleri çözebilmektedirler.
Teknikler birbiriyle tamamlayıcı olsa da, çeşitli sorunları ele alma şekilleri onları farklı zorluklarla başa çıkmaya olanak tanır.
BDM Modellerinin Uzun Süre Düşünmesini Sağlamak
Akıl yürütme zinciri, bu tür akıl yürütmenin en basit temsilidir. Modeli, nihai bir yanıt üretmeden önce adım adım düşünmeye teşvik ederiz.
Akıl yürütme zincirinin bir iterasyonu ise, ReAct ajans çerçevesidir. ReAct, çok adımlı karar verme işlemini gerçekleştirmek için akıl yürütmeyi ve eylemi birleştirir. Akıl yürütme izleri üreterek, ajans karmaşık problemi daha yönetilebilir alt görevlere ayırarak stratejik bir plan geliştirir. Eylem adımı, planı gerçekleştirmek için dış araçlarla etkileşimde bulunur.
Derin düşünmeyi artırmayı amaçlayan bir diğer teknik ise öz değerlendirmeyi tanıtmıştır; bu durum, ajansın akıl yürütmesini analiz edip yeniden değerlendirmesine neden olur ve böylece daha güvenilir bir yanıt üretmesini sağlar.
Bu kavram, DeepSeek-R1 ile güçlendirilmiştir. DeepSeek-R1, akıl yürütme zincirinin tutarlılığını ve derinliğini artırmak için ayarlanmıştır. Bu model, kendi akıl yürütme stratejilerini otonom olarak keşfedip geliştirmesine olanak tanıyan yeni bir pekiştirmeli öğrenme (RL) paradigmasını benimsemiştir. Bu, onu şimdiye kadar var olan en ilginç uzun zincir, çok adımlı akıl yürütme uygulamalarından biri haline getirir.
Bu tür akıl yürütme, çok adımlı bir soru yanıtlamak veya mantık problemini çözmek gibi karmaşık problemlerle çalışmak için en uygunudur.
BDM Modellerinin En İyi Çözümü Aramasında Yardımcı Olmak
Uzun düşünme, görevlerin karmaşıklığını ele alırken, çoklu çözümleri olan görevleri çözmek için en iyi yaklaşım olmayabilir. Ağaç düşüncesi ve Graf düşüncesi gibi teknikler, BDM’nin birden fazla akıl yürütme yönüyle hesap yapmasını sağlar.
En İyi-N, Model Parametrelerini Ölçeklendirmeden Daha Etkili Olabilir makalesinde detaylı olarak ele alınan basit bir prensip kullanır. Eğer modele birçok deneme sunulursa, doğru yanıtı üretme olasılığı artar. Özünde, modeli aynı soruyu tekrar tekrar sorduğumuzda doğru yanıtı alma olasılığımız yükselir.
Burada N sayısını, bazı araştırmaların yüksek değerler kullandığı gibi, herhangi bir şekilde ayarlamak mümkündür. Ancak büyük bir yanıt hacmi üretmek sadece sorunun küçük bir parçasıdır; en iyi N çözümleri seçmek için bir yola ihtiyacımız vardır.
İşte bu noktada doğrulama problemi devreye girmektedir! Bazı durumlarda, bu daha hemen anlaşılırdır: Kod çalışır mı ve testleri geçer mi? Diğer durumlarda, daha karmaşık olabilir ve bir ödül modeline veya başka karmaşık bir doğrulama sürecine dayanabilir.
Düşün-Eleştir-İyileştir ile Etkileşime Geçmek
Problemi “daha fazla düşünme” merceğinden ele almak yerine, Düşün-Eleştir-İyileştir gibi yaklaşımlar, sağlam yanıtlar üretmek için daha etkileşimli bir süreçten yararlanır. Kısacası süreç şu şekildedir:
- Düşün:N örneği üret, En iyi-N yaklaşımlarına benzer.
- Geri bildirim oluştur: Her örnek için, belirli bir modele dayanarak X geri bildirim yanıtları üret ve bunları kullanışsız yanıtlar için filtrele. Bazı sezgisel kriterlere dayanarak en iyi k’yi seç.
- Düzenle: Her bir N örneği ile birlikte en iyi k geri bildirim yanıtlarını içeren bir özel düzenleyici model, geri bildirimle asıl modelin yanıtını düzenler.
- Seç: Sonuç olarak, bu süreçte oluşturulan yanıtlar arasından nihai yanıtı seç.
Bu yaklaşım, bir grup insanların bir sorun üzerinde çalışmasına daha çok benzer; tek bir kişinin sorunu uzun bir süre düşünmesine göre.
Diğer yöntemler, eğitimleri veya uygulamalarında doğrulabilir problemleri (kod, matematik ve mantıksal akıl yürütme) kullanırken, bu yöntem açık uçlu problemlerde düzeltme yaparak en büyük başarıyı elde eder.
Gelecek Adımlar
Model ve tekniklerdeki hızlı ilerlemeler, işletmelerin pazar süresine ve özelliklerini geliştirmeye odaklanmaları gerektiği anlamına geliyor.
Bu ortamda, NVIDIA Mavi Taslakları, işletmelerin kullanıcılarına uygulama geliştirmelerini hızlandırarak çözüm sunmaktadır. İşletmeniz, kullanışlı, güvenli ve güvenilir bir altyapıya sahip olmasını sağlamak için NVIDIA NIM kullanabilir.
Geliştiriciler bugün, en son NVIDIA Llama Nemotron modellerini Hugging Face’den indirerek veya Bir Araştırma ve Raporlama için AI Ajansı Oluşturma NVIDIA AI Taslağını deneyerek başlayabilir.
BDM ajansları hakkında daha fazla bilgi için bu dizi içindeki diğer bloglara göz atabilirsiniz:
- Bir BDM Destekli API Ajansı Oluşturma
- BDM Ajanslarına Giriş
- İlk BDM Ajansı Uygulamanızı Oluşturma
- Bir BDM Destekli Veri Ajansı Oluşturma