Google’ın Yeni Başarısı: Gemini 2.5 Pro ile Pokémon Blue’u Geçti!
Google’ın en pahalı yapay zeka modeli önemli bir başarıya imza attı: 29 yıllık bir video oyununu geçmek!
Dün gece, Google CEO’su Sundar Pichai, X platformunda yaptığı bir paylaşımla, “Ne harika bir finale imza attık! Gemini 2.5 Pro, Pokémon Blue’u tamamladı!” diyerek bu durumu duyurdu.
Kim Yönlendirdi?
Burada dikkate değer olan ise “Gemini Plays Pokémon” livestream’inin, Google ile bağlantısı olmayan 30 yaşındaki bir yazılım mühendisiJoel Z tarafından yönetilmesidir. Ancak, Google yöneticileri bu çabayı destekleyerek durumu kutluyor.
Örneğin, Google AI Studio’nun ürün lideri Logan Kilpatrick, geçen ay, Gemini’nin “Pokémon’u tamamlama yolunda büyük ilerleme kaydettiğini” ve “5. rozetini kazandığını” duyurdu. Bu durumun diğer güçlü modellerden daha iyi olduğunun altını çizen Pichai ise, şaka yollu, “Şu an API üzerinde çalışıyoruz, Yapay Pokémon Zekası :)” dedi.
Pokémon Neden Seçildi?
Neden Pokémon? Şubat ayında Anthropic, Claude AI modellerinin “Pokémon Red” üzerinden kaydettiği ilerlemeleri vurgulamıştı. Claud’un “uzun düşünce ve ajan eğitimi” sayesinde beklenmedik görevlerde başarılı olduğu ifade edildi. (“Pokémon Red” ve “Blue”, 1996’da piyasaya sürülen ve uzun süredir devam eden Pokémon franchise’ı ile bağlantılı bir GameBoy oyunudur.) Joel Z, bu projede ilham kaynağı olarak Claude Plays Pokémon Twitch kanalını gösterdi.
Her ne kadar Claude, hala “Pokémon Red”i geçememiş olsa da, Gemini’nin oyunu tamamlaması, doğrudan bir karşılaştırma yapmayı zorlaştırıyor. Joel Z, Twitch sayfasında, “Lütfen bunu bir benchmark (ölçüt) olarak düşünmeyin. Doğrudan karşılaştırmalar yapmak mümkün değil – Gemini ve Claude farklı araçlar kullanıyor ve farklı bilgiler alıyor,” dedi.
Yardımcı Araçlar ve Geliştirme Süreci
Her iki AI modeli de oyunu oynamak için yardıma ihtiyaç duyuyor. Bu noktada, ajan kıvrımları devreye giriyor; bu sistem, modellere oyun ekran görüntüleri ve ek bilgi sunarak, modelin nasıl yanıt vereceğine karar vermesine yardımcı oluyor. Ayrıca, AI’nın talimatına uymak için hangi düğmeye basması gerektiğini de yönetiyorlar.
Joel Z, Gemini’yi tamamlamak için başka “geliştirici müdahale” lerinin de olduğunu kabul etti ancak bu durumu hile olarak nitelendirmedi. “Benim müdahalelerim, Gemini’nin genel karar verme ve muhakeme yeteneklerini geliştiriyor,” diyor. “Kesin ipuçları vermiyorum – özel zorluklar için doğrudan talimatlar yok; yalnızca Gemini’nin iki kez bir Rocket Grunt ile konuşması gerektiğini belirtmek gibi bilgiler veriyorum,” diye ekliyor ve bu durumun Pokémon Yellow’da sonradan düzeltildiğini ifade ediyor.
Gemini Plays Pokémon projesi hala aktif olarak geliştiriliyor ve çerçevesinin sürekli evrildiği bilgisi de veriliyor. Bu noktada ilerleme kaydetmek için çalışmalar devam ediyor.