Google, Çoklu Fikir Testi Yapan Gemini Deep Think AI’yi Tanıttı

08/02/2025 8:54 AM

Google DeepMind, Yeni AI Modelini Tanıttı

Google DeepMind, en gelişmiş AI akıl yürütme modeli olan Gemini 2.5 Deep Think‘i tanıttı. Şirket, bu modelin çok sayıda fikri aynı anda değerlendirip en iyi cevabı bulma yeteneğine sahip olduğunu ifade ediyor.

Google’ın $250 aylık Ultra aboneliğine sahip kullanıcılar, Gemini uygulaması üzerinden bu modele cuma günü erişim sağlayacaklar.

Multi-Ajan Yaklaşımıyla Yarar Sağlıyor

Gemini 2.5 Deep Think, Mayıs 2025‘te düzenlenen Google I/O etkinliğinde ilk kez duyurulmuştu ve Google’ın halka açık ilk multi-agent modeli olma özelliğini taşıyor. Bu sistemler, bir sorunun yanıtını bulmak için birden fazla AI ajanı çalıştırarak çoklu işlem yapıyor. Bu cins bir yaklaşım, tek bir ajan kullanmaya göre çok daha fazla hesaplama gücü gerektiriyor, fakat genellikle daha iyi sonuçlar veriyor.

Google, bu modelin bir varyasyonunu kullanarak bu yılki Uluslararası Matematik Olimpiyatı’nda altın madalya kazanmayı başardı.

Gemini 2.5 Deep Think ile birlikte, şirket IMO’da kullandığı modeli seçkin matematikçiler ve akademisyenlerle paylaşacağını duyurdu. Google, bu modelin, çoğu tüketici odaklı AI modellerinin saniyeler veya dakikalar içinde sonuç ürettiği bir süreçte, saate yayılacak bir akıl yürütme süresi gerektirdiğini belirtiyor. Şirket, bu modelin araştırma çabalarını artırmayı ve akademik kullanımlar için multi-agent sistemini geliştirme konusunda geri bildirim almayı umut ediyor.

Özgün Gelişmeler ve Başarılar

Google, Gemini 2.5 Deep Think modelinin Google I/O‘da tanıtılan modelden önemli ölçüde geliştirilmiş olduğunu vurguluyor. Şirket, daha iyi akıl yürütme yolları kullanmayı teşvik etmek için yenilikçi pekiştirmeli öğrenme teknikleri geliştirdiklerini de ekliyor.

“Deep Think, yaratıcılık, stratejik planlama ve adım adım iyileştirme gerektiren sorunları çözmede insanlara yardımcı olabilir,” ifadesini paylaştı Google, TechCrunch ile yaptığı bir blog gönderisinde.

Şirket, Gemini 2.5 Deep Think modelinin İnsanlığın Son Sınavı (HLE) adı verilen zorlu bir testte, matematik, beşeri bilimler ve bilim alanında kalabalık kaynaklardan sağlanan binlerce soruyu yanıtlamak için olağanüstü bir performans sergilediğini belirtti. Google, modelinin bu testte 34.8% puan aldığını, xAI‘nin Grok 4’ün 25.4%, OpenAI’nin o3 modelinin ise 20.3%% puan aldığını açıkladı.

Google ayrıca, Gemini 2.5 Deep Think’in LiveCodeBench 6, zorlu bir rekabetçi kodlama görevleri testi üzerinde de açıkça daha iyi sonuçlar verdiğini ekledi. Şirketin modeli bu testte 87.6% puan alırken, Grok 4 79% ve OpenAI’nin o3 modeli 72%% puan aldı.

Uzun Yanıtlar ve Yaratıcı Çalışmalar

Gemini 2.5 Deep Think, kod yürütme ve Google Arama gibi araçlarla otomatik olarak çalışarak, geleneksel AI modellerinden çok daha uzun yanıtlar üretebiliyor.

Google’ın testlerinde bu model, diğer AI modellerine kıyasla daha detaylı ve estetik açıdan hoş web geliştirme görevleri üretti. Şirket, bu modelin araştırmacılara yardımcı olabileceğini ve keşif yolunu hızlandırma potansiyeline sahip olduğunu ifade etti.

Görünüşe göre, birçok öncü AI laboratuvarı multi-agent yaklaşımında birleşiyor. Elon Musk‘ın xAI şirketi de kendi multi-agent sistemi olan Grok 4 Heavy‘yi yayınladı. Bu sistemin çeşitli testlerde sektörde lider performans sergilediği belirtiliyor.

OpenAI araştırmacısı Noam Brown, Uluslararası Matematik Olimpiyatı’nda. altın madalya almak için kullanılan henüz yayımlanmamış bir AI modelinin de multi-agent sistemi içerdiğini ifade etti. Anthropic şirketinin araştırma ajansı, kapsamlı araştırma raporları üreten bir multi-agent sistemiyle çalışmaktadır.

Güçlü performansına rağmen, multi-agent sistemlerinin geleneksel AI modellerinden daha pahalı olduğu anlaşılıyor. Bu nedenle teknoloji şirketleri, bu sistemleri en pahalı abonelik planları arkasında tutmayı tercih edebilirler.

Önümüzdeki haftalarda, Google Gemini 2.5 Deep Think’i belirli bir test grubuna sunmayı planlıyor. Şirket, geliştiricilerin ve işletmelerin bu multi-agent sistemini nasıl kullanabileceğini daha iyi anlamak istiyor.

SON DAKİKA

Google, Çoklu Fikir Testi Yapan Gemini Deep Think AI’yi Tanıttı