“Kolayca Anlaşılır: LLM Mantığı, Yapay Zeka Ajanları ve Test Süresi Ölçeklendirme”

Ajanslar, büyük dil modellerini (BDM’ler) karmaşık problemleri çözmek için uygulamanın başlıca sürücüleridir. 2023’teki AutoGPT‘nin çıkışından bu yana, çeşitli teknikler, farklı endüstrilerde güvenilir ajanslar inşa etmek için geliştirilmiştir. Ajansik akıl yürütme ve yapay zeka akıl yürütme modelleri etrafındaki tartışmalar, bu uygulamaların tasarımına daha fazla derinlik katmaktadır. Ayrıca, bu gelişmelerin hızlı temposu, geliştiricilerin bu ajansları oluşturma yolunda birçok tasarım ve teknik seçeneği arasından seçim yapmalarını zorlaştırmaktadır.

Bu kararları basitleştirmek adına, bu yazıda şu geniş konular ele alınacaktır:

BDM ajansı nedir ve hangi yapısal kalıplar dikkate alınmalıdır?
BDM akıl yürütmesi ve test zamanı ölçeklendirmesi nasıl çalışır?
Düşünülmesi gereken farklı akıl yürütme türleri nelerdir?

BDM Ajansı Nedir?

BDM ajansları, karmaşık bir problemi çözmek için bir BDM kullanarak akıl yürütme yapar, bir plan oluşturur ve bir görevi tamamlamak için araçlar veya API’ler kullanır. Bu, onları akıllı sohbet robotları, otomatik kod üretimi ve iş akışı otomasyonu gibi üretken yapay zeka kullanım durumları için mükemmel hale getirir. BDM ajansları, daha geniş yapay zeka ajansı manzarasının sadece bir kesitidir: ajansik yapay zeka terimi ayrıca, bilgisayarla görme modelleri, konuşma modelleri ve pekiştirmeli öğrenme ile çalışan ajansları da kapsar ve bunlar müşteri hizmetleri sohbet robotlarından karmaşık kurumsal süreç orkestrasyonuna veya kendi kendine giden arabalara kadar her şeyde yer alır.

Uygulama alanlarına göre, BDM ajansları temel olarak sohbet robotları ve iş akışları olarak ikiye ayrılabilir. Eğer ajanslarla yeni tanışıyorsanız, bu makale, ilk ajansınızı inşa ederek kavramsal parçaları öğrenmenize yardımcı olacaktır!

İş Akışları

Robotic Process Automation (RPA) boru hatları, genellikle veri girişi, talep dosyalama ve müşteri ilişkileri yönetimi (CRM) gibi mekanik görevleri otomatikleştirmek için kullanılır. Bu sistemler, genellikle arka planda çalışan çevrimdışı parti işlerini çözmek üzere tasarlanmıştır.

Bu sistemler, genellikle katı kurallar ve sezgisel süreçler etrafında tasarlanmıştır. Bu durum, RPA boru hatlarının uygulama alanını kısıtlar ve genellikle ölçeklenebilir olmalarıyla ilgili sorunlara yol açar.

BDM’ler sayesinde, bu ajans boru hatları, karmaşık kararlar alabilme ve problemi çözmek için uygun araçları kullanma yeteneği ile esnek hale getirilebilir.

BDM ajanslarının RPA boru hatlarını devrim niteliğinde değiştirebileceği bir kullanım durumu, sigorta ve sağlık hizmetleri endüstrilerinde talep işleme olabilir. Geleneksel RPA boru hatları, veri yapısında katı olduğundan, BDM ajansları, müşteri yüklemeleri gibi farklı belge biçimlerinden gelen karmaşık verileri işleyebilirler.

Ajanslar ayrıca talebe dayalı dinamik iş akışları geliştirebilir, potansiyel dolandırıcılık tespitinde yardımcı olabilir, değişen düzenlemelere bağlı olarak karar verme süreçlerini ayarlayabilir veya karmaşık talep senaryolarını analiz ederek, poliçe ve geçmiş verilere dayanarak uygun eylemleri önerirken yardımcı olabilir.

Bir iş akışında, ajanslar, karmaşık bir görevi, esas olarak iş mantığı tarafından belirlenen kesin sınırlı yollara bölerek tanımlanan bir önceden belirlenmiş boru hattında çalışır. Bu durumlarda, BDM’ler her alt görevin belirsizliğini gidermek için kullanılır ancak üst düzey görev akışı önceden belirlenmiştir.

A workflow diagram shows a workflow style application of agents where a complex task is broken down into simpler subtasks by the software architect, and the LLMs help resolve complexity in the minutia of individual step. — *Şekil 1. Bir CVE etki analizi için planla ve uygula tarzı BDM ajansı boru hattı.*

Şekil 1, nakledilen konteynerlerdeki zafiyetleri tespit etmeye yardımcı olan bir CVE analiz iş akışının bir örneğini göstermektedir. Bu boru hattı iyi tanımlanmış olup kesin, özgül alt görevlerden oluşmaktadır.

Sohbet Robotları

Ajansların bir diğer kullanım durumu, yapay zeka sohbet robotlarıdır. Yanıt gecikmesine ve çözdükleri görevin doğasına bağlı olarak, bu sohbet robotları şu şekilde kategorize edilir:

Keşif Ajansları
Destekleyici Ajanslar

Keşif ajansları, genellikle karmaşık çok adımlı görevleri çözmek üzere tasarlanmış ajanslardır ve bu görevler zorlayıcıdır ve ajansın uygulanması zaman alır. Bu ajanslar, kullanıcıların görevler verdiği bağımsız ajanslar olarak düşünülebilir.

Harika bir örnek, OpenAI ve Perplexity’nin Deep Research‘üdür. Bu ajanslar karmaşık çok adımlı bir problemi akıl yürütme yoluyla çözer ve nihai bir çözüm bulmaya çalışır. Bu durumlarda kullanıcılar, yinelemeli etkileşimlerden ziyade bağımsız bir tamamlanma beklerler.

An example of an exploratory task open ended task for which agents are used — *Şekil 2. Deep Research yanıtının örneği (kaynak: Perplexity)*

Destekleyici ajanslar, temelde kullanıcıların karar verme sürecine dahil olduğu işbirlikçi bir insan-döngüsü deneyimi gerektirir. Bu ajanslar, genellikle dar bir araç setini kullanarak tasarlanır.

Örneğin, bu uygulamalar belge yazım asistanları, kişisel yapay zeka asistanları, vergi beyannamesi asistanları gibi olabilir. Bu ajanslar, daha az gecikme ile daha küçük, çoğu zaman tekrar eden sorunları çözmek üzere inşa edilmiştir.

A user Interface showing a Python file open in a coding environment. The user is asking a coding assistant to modify part of the code. The assistant responded with suggested edits. — *Şekil 3. Mevcut bir Python dosyasında düzenleme için bir kod asistanına talepte bulunma.*

Tüm bu ajanslar, bir görevi çözme planı oluşturarak ve bazı araçların yardımıyla akıl yürütme gerektirir (Şekil 3).

BDM Akıl Yürütmesi Nedir?

Oxford Sözlüğü akıl yürütmeyi, “bir şeyi mantıklı ve akla yatkın bir şekilde düşünme eylemi” olarak tanımlar. Bu tanım, BDM’ler ile akıl yürütme paradigmasını düşünürken oldukça uygundur.

Son birkaç yılda, Planla ve Uygula, BDM derleyici ve Dil Ajansı Ağaç Arama gibi birçok akıl yürütme çerçevesi gelişmiştir ve DeepSeek-R1 gibi akıl yürütme modelleri de ortaya çıkmıştır. Şimdi sorulması gereken, bu gelişmeleri nasıl bağlamlandırıp holistik bir görüş elde edebileceğimizdir.

Bu bağlamda akıl yürütme, geniş hatlarıyla aşağıdaki kategorilere ayrılabilir:

Uzun Düşünme
En İyi Çözümü Arama
Düşün, Eleştir, İyileştir

There are three broad categories of reasoning - Think Longer, Diverse Thinking and Critique thinking, each of which have their own niches. — *Şekil 4. Geniş akıl yürütme kategorileri, her birinin kendine özgü uygulama alanları bulunmaktadır.*

Bütün bu teknikler, test zamanı hesaplamasını ölçeklendirme ile çalışarak, yanıtların kalitesini artırmakta ve daha karmaşık problemleri çözebilmektedirler.

Teknikler birbiriyle tamamlayıcı olsa da, çeşitli sorunları ele alma şekilleri onları farklı zorluklarla başa çıkmaya olanak tanır.

BDM Modellerinin Uzun Süre Düşünmesini Sağlamak

Akıl yürütme zinciri, bu tür akıl yürütmenin en basit temsilidir. Modeli, nihai bir yanıt üretmeden önce adım adım düşünmeye teşvik ederiz.

Akıl yürütme zincirinin bir iterasyonu ise, ReAct ajans çerçevesidir. ReAct, çok adımlı karar verme işlemini gerçekleştirmek için akıl yürütmeyi ve eylemi birleştirir. Akıl yürütme izleri üreterek, ajans karmaşık problemi daha yönetilebilir alt görevlere ayırarak stratejik bir plan geliştirir. Eylem adımı, planı gerçekleştirmek için dış araçlarla etkileşimde bulunur.

Derin düşünmeyi artırmayı amaçlayan bir diğer teknik ise öz değerlendirmeyi tanıtmıştır; bu durum, ajansın akıl yürütmesini analiz edip yeniden değerlendirmesine neden olur ve böylece daha güvenilir bir yanıt üretmesini sağlar.

Bu kavram, DeepSeek-R1 ile güçlendirilmiştir. DeepSeek-R1, akıl yürütme zincirinin tutarlılığını ve derinliğini artırmak için ayarlanmıştır. Bu model, kendi akıl yürütme stratejilerini otonom olarak keşfedip geliştirmesine olanak tanıyan yeni bir pekiştirmeli öğrenme (RL) paradigmasını benimsemiştir. Bu, onu şimdiye kadar var olan en ilginç uzun zincir, çok adımlı akıl yürütme uygulamalarından biri haline getirir.

An example of “Deeper Thinking” are the thinking tokens that are used to generate a single cohesive chain of thought to reason through a complex problem — *Şekil 5. DeepSeek-R1’in akıl yürütme düşünceleri sergiliyor.*

Bu tür akıl yürütme, çok adımlı bir soru yanıtlamak veya mantık problemini çözmek gibi karmaşık problemlerle çalışmak için en uygunudur.

BDM Modellerinin En İyi Çözümü Aramasında Yardımcı Olmak

Uzun düşünme, görevlerin karmaşıklığını ele alırken, çoklu çözümleri olan görevleri çözmek için en iyi yaklaşım olmayabilir. Ağaç düşüncesi ve Graf düşüncesi gibi teknikler, BDM’nin birden fazla akıl yürütme yönüyle hesap yapmasını sağlar.

En İyi-N, Model Parametrelerini Ölçeklendirmeden Daha Etkili Olabilir makalesinde detaylı olarak ele alınan basit bir prensip kullanır. Eğer modele birçok deneme sunulursa, doğru yanıtı üretme olasılığı artar. Özünde, modeli aynı soruyu tekrar tekrar sorduğumuzda doğru yanıtı alma olasılığımız yükselir.

Burada N sayısını, bazı araştırmaların yüksek değerler kullandığı gibi, herhangi bir şekilde ayarlamak mümkündür. Ancak büyük bir yanıt hacmi üretmek sadece sorunun küçük bir parçasıdır; en iyi N çözümleri seçmek için bir yola ihtiyacımız vardır.

İşte bu noktada doğrulama problemi devreye girmektedir! Bazı durumlarda, bu daha hemen anlaşılırdır: Kod çalışır mı ve testleri geçer mi? Diğer durumlarda, daha karmaşık olabilir ve bir ödül modeline veya başka karmaşık bir doğrulama sürecine dayanabilir.

The diagram shows three models: Best of N, Beam Search, and Look Ahead search. Each workflow starts with a question and then shows the prompt, intermediate solution steps, and solution steps selected or rejected by the verifier. — *Şekil 6. Arama teknikleri türleri*

Düşün-Eleştir-İyileştir ile Etkileşime Geçmek

Problemi “daha fazla düşünme” merceğinden ele almak yerine, Düşün-Eleştir-İyileştir gibi yaklaşımlar, sağlam yanıtlar üretmek için daha etkileşimli bir süreçten yararlanır. Kısacası süreç şu şekildedir:

Düşün:N örneği üret, En iyi-N yaklaşımlarına benzer.
Geri bildirim oluştur: Her örnek için, belirli bir modele dayanarak X geri bildirim yanıtları üret ve bunları kullanışsız yanıtlar için filtrele. Bazı sezgisel kriterlere dayanarak en iyi k’yi seç.
Düzenle: Her bir N örneği ile birlikte en iyi k geri bildirim yanıtlarını içeren bir özel düzenleyici model, geri bildirimle asıl modelin yanıtını düzenler.
Seç: Sonuç olarak, bu süreçte oluşturulan yanıtlar arasından nihai yanıtı seç.

Bu yaklaşım, bir grup insanların bir sorun üzerinde çalışmasına daha çok benzer; tek bir kişinin sorunu uzun bir süre düşünmesine göre.

Diğer yöntemler, eğitimleri veya uygulamalarında doğrulabilir problemleri (kod, matematik ve mantıksal akıl yürütme) kullanırken, bu yöntem açık uçlu problemlerde düzeltme yaparak en büyük başarıyı elde eder.

Gelecek Adımlar

Model ve tekniklerdeki hızlı ilerlemeler, işletmelerin pazar süresine ve özelliklerini geliştirmeye odaklanmaları gerektiği anlamına geliyor.

Bu ortamda, NVIDIA Mavi Taslakları, işletmelerin kullanıcılarına uygulama geliştirmelerini hızlandırarak çözüm sunmaktadır. İşletmeniz, kullanışlı, güvenli ve güvenilir bir altyapıya sahip olmasını sağlamak için NVIDIA NIM kullanabilir.

Geliştiriciler bugün, en son NVIDIA Llama Nemotron modellerini Hugging Face’den indirerek veya Bir Araştırma ve Raporlama için AI Ajansı Oluşturma NVIDIA AI Taslağını deneyerek başlayabilir.

BDM ajansları hakkında daha fazla bilgi için bu dizi içindeki diğer bloglara göz atabilirsiniz:

Bir BDM Destekli API Ajansı Oluşturma
BDM Ajanslarına Giriş
İlk BDM Ajansı Uygulamanızı Oluşturma
Bir BDM Destekli Veri Ajansı Oluşturma

SON DAKİKA