Gündelik ve haftalık bültenlerimize katılın, sektör lideri AI haberleri hakkında en son güncellemeleri ve özel içerikleri yakalayın. Daha Fazla Öğrenin
Google, popüler yapay zeka modeli Gemini‘nin büyük bir güncellemesini sessizce yayımladı. Bu güncelleme, modelin mantığını açıklama, matematik ve bilimsel görevlerde yeni performans rekorları kırma ve OpenAI’nın premium hizmetlerine ücretsiz bir alternatif sunma yeteneğini içeriyor.
Yeni Gemini 2.0 Flash Thinking modeli, Salı günü Google AI Studio‘nda deneysel “Exp-01-21” adı altında yayımlandı. Model, American Invitational Mathematics Examination (AIME) sınavında %73,3 ve GPQA Diamond bilimsel benchmarkında %74,2 puan aldı. Bu sonuçlar, önceki AI modellerine kıyasla belirgin iyileştirmeler gösteriyor ve Google’ın gelişmiş akıl yürütmedeki artan gücünü ortaya koyuyor.
Gemini 2.0 Flash Thinking Rekorlar Kırıyor
Modelin en dikkat çekici özelliği, bir milyon token metni işleme kapasitesidir. Bu, OpenAI’nin o1 Pro modeline kıyasla beş kat daha fazladır ve hızla yanıt sürelerini korurken büyük veri setlerini veya çok sayıda araştırma makalesini aynı anda analiz etme imkanı sunmaktadır.
“Bir ilk deney olarak, çeşitli dini ve felsefi metinleri bir araya getirip Gemini 2.0 Flash Thinking modeline sorular sordum, yeni ve benzersiz içgörüler çıkarmasını istedim,” diyor AI araştırmacısı Dan Mac. “Toplamda 970,000 token işledi. Elde edilen sonuç oldukça etkileyici.”
Ücretsiz Gemini 2.0 Flash Thinking ve Kod Yürütme Özelliği
Jeff Dean, Google DeepMind’deki Baş Bilim insanı, modelin güvenilirlikteki iyileşmelerine dikkat çekti: “Daha yüksek güvenilirlik ve modelin düşünceleri ile nihai yanıtları arasında daha az çelişki ile yine de iterasyon yapıyoruz,” yazdı.
Model ayrıca, yazılımcıların sistem içinde doğrudan kod çalıştırmasını ve test etmesini sağlayan yerleşik bir kod yürütme yeteneğine sahiptir. Geliştirilmiş çelişki önleyici mekanizmalarla birlikte, Gemini 2.0 Flash Thinking’i hem araştırma hem de ticari uygulamalar için ciddi bir aday haline getiriyor.
AI Şeffaflığı Yeni Savaş Alanı Oluyor
Google‘nin, mantığını açıklama konusundaki odaklanması, AI’nın şeffaflık ve güvenilirlik konusundaki artan endişeleri gidermeye yardımcı olabilir. Geleneksel “kara kutu” modellerin aksine, Gemini 2.0 Flash Thinking işleyişini göstererek kullanıcıların sonuçlarını anlamasını ve doğrulamasını kolaylaştırıyor.
Model, Chatbot Arena liderliğinde de en üst sıraya yerleşti. Ancak, modelin gerçek dünya performansı ve sınırlamaları konusunda sorular devam ediyor.
Hızla büyüyen AI endüstrisinde, Google’ın son çıkışı, gelişmiş yetenekleri erişilebilirlik ile birleştirmeye yönelik bir strateji değişimi önermektedir. Bu yaklaşımın, OpenAI ile olan yarışı kapatıp kapatamayacağı belirsiz, ancak teknik karar vericiler için dikkat çekici bir alternatif sunuyor.
Şu an için kesin olan bir şey var: Görüşlerini açıklayan AI dönemi başlamış durumda ve bu, Google hesabına sahip herkes için erişilebilir.