DeepMind, Google’ın yapay zeka araştırma merkezi, “sonsuza kadar” oynanabilir 3D dünyalar üretebilen bir model tanıttı.
Genie 2: Yeni Bir Dünya Modeli
Yeni adıyla Genie 2, bu model; bu yılın başında tanıtılan öncülü Genie’nin bir successor’ı olarak ortaya çıktı. Model, tek bir görüntü ve metin tanımından (örneğin, “Ormanda sevimli bir insansı robot”) etkileşimli ve gerçek zamanlı sahneler oluşturabiliyor. Bu özelliği, Fei-Fei Li’nin World Labs ve İsrailli girişim Decart gibi firmaların geliştirdiği modellere benziyor.
Gelişmiş Simülasyon Yeteneği
DeepMind, Genie 2’nin “zengin 3D dünyaların geniş bir çeşitliliğini” üretebildiğini iddia ediyor. Kullanıcılar, bir fare veya klavye ile zıplama ve yüzme gibi eylemler gerçekleştirebiliyorlar. Videolar üzerinde eğitilen model, nesne etkileşimlerini, animasyonları, aydınlatmayı, fiziği, yansımaları ve “NPC’lerin” davranışlarını simüle edebiliyor.
Oyunla İlgili Fikirler ve Telif Hakları
Genie 2’nin simülasyonlarının çoğu AAA video oyunları gibi görünüyor. Bunun nedeni, modelin eğitim verilerinin popüler oyunların oynanışlarını içermesi olabilir. Ancak DeepMind, birçok AI laboratuvarı gibi, veri kaynaklarıyla ilgili ayrıntıları gizli tutuyor.
Telif hakkı konuları akıllarda soru işareti bırakıyor. DeepMind, bir Google yan kuruluşu olarak, YouTube’a kolay erişime sahip ve Google, kullanım şartlarının YouTube videolarını model eğitimi için kullanma izni verdiğini öne sürmüştü. Ancak, Genie 2’nin “izlediği” video oyunlarının yetkisiz kopyalarını mı oluşturduğuna karar vermek yargıya düşüyor.
Genie 2, kullanıcıların bakış açılarına bağlı olarak tutarlı dünyalar oluşturabiliyor. İlk şahıs ve izometrik görünümler gibi farklı perspektiflere, bir dakikaya kadar sürekli dünyalar yaratabiliyor; çoğu ise 10 ila 20 saniye sürüyor.
“Genie 2, klavye üzerinden gerçekleştirilen eylemlerle akıllıca yanıt veriyor; karakterin tanımlanmasını sağlayarak doğru bir şekilde hareket ettiriyor,” diye belirtti DeepMind.
Simülasyonlar Arasındaki Farklar
Çoğu dünya modeli, oyunları ve 3D ortamları simüle edebilse de, genellikle hata, tutarlılık ve yanıltma sorunları yaşıyor. Örneğin, Decart’ın Minecraft simülatörü Oasis, düşük çözünürlükte ve seviyelerin düzenini hızla “unutuyor”. Ancak Genie 2, görünmeyen kısımları hatırlayıp yeniden görünür hale geldiğinde bunları doğru bir şekilde yeniden üretebiliyor.
Genie 2 ile oluşturulan oyunlar, eğlenceli olmayabilir çünkü her bir dakikada ilerlemeyi silme özelliği var. Bu nedenle DeepMind, bu modeli, prototipleme ve AI ajanslarının değerlendirilmesi için bir araştırma ve yaratıcı araç olarak konumlandırıyor.
Yaratıcılık ve Sanat Dünyası Üzerindeki Etki
Dankı Genie 2’nin dağıtım dışı genel yeteneği sayesinde, konsept sanatları ve çizimler, tamamen etkileşimli ortamlara dönüştürülebiliyor. “Genie 2’yi kullanarak hızlı bir şekilde zengin ve çeşitli ortamlar oluşturmak, araştırmacılara daha önce eğitim sırasında görmedikleri değerlendirme görevleri oluşturma olanağı sağlıyor,” dedi DeepMind.
Ancak, video oyun endüstrisindeki yaratıcılar karışık duygulara sahip olabilir. Wired’ın yakın zamanda yaptığı bir araştırma, Activision Blizzard gibi büyük oyuncuların, iş gücü kaybını telafi etmek ve verimliliği artırmak için AI kullanmaya yöneldiğini ortaya koydu.
Yine de, Google, dünya modeli araştırmalarına giderek artan kaynaklar ayırıyor. Geçtiğimiz Ekim ayında, OpenAI’ın Sora video jeneratörü üzerindeki geliştirmeleri yöneten Tim Brooks’u video üretim teknolojileri ve dünya simülatörleri üzerine çalışması için işe aldı. Ayrıca, iki yıl önce, Meta’dan tanınmış “açık uçluluk” deneyleri yürütücüsü Tim Rocktäschel’ın alımıyla dikkat çekti.