OpenAI’nin Video Üretim Modeli Sora’nın Yükselişi
OpenAI, video üreten yapay zeka modeli Sora‘yı tanıttığında, bu modelin eğitiminde hangi verilerin kullanıldığını tam anlamıyla açıklamadı. Ancak, görünen o ki, bazı veriler Twitch yayınlarından ve oyun rehberlerinden gelmiş olabilir.
Sora, pazartesi günü piyasaya sürüldü ve ben de biraz deneme fırsatı buldum. Metin veya görsel girişi ile, Sora, 20 saniyeye kadar videolar üretebiliyor; farklı görüntü oranları ve çözünürlüklerle çalışabiliyor.
Oyun İçerikleri ve Yetenekleri
OpenAI, Sora’nın ilk kez Şubat ayında tanıtımını yaptığında, bu modelin eğitiminde Minecraft videolarına atıfta bulundu. Bu durum, başka hangi oyunların içeriklerinin Sora’nın eğitim setinde yer alabileceği konusunda merak uyandırıyor.
Sora’nın birçok farklı video türü üretebildiği anlaşılıyor. Örneğin, bir Super Mario Bros. klonu gibi bir video oluşturabiliyor:
Üstelik, Call of Duty ve Counter-Strike oyunlarından esinlenmiş gibi görünen bir birinci şahıs nişancı oyunu videosu da oluşturabilmekte:
Ayrıca, 90’lar yapımı Teenage Mutant Ninja Turtles oyununa benzer bir dövüş videosu da create edebiliyor:
Twitch Yayıncıları ve Yasal Sorunlar
Sora’nın, bir Twitch akışı görüntüsünü nasıl oluşturduğuna dair bir anlayış geliştirdiği de anlaşılıyor. Aşağıdaki ekran görüntüsüne bakalım, genel hatlarıyla doğru bir görünüm sergiliyor:
Bu ekran görüntüsü, popüler Twitch yayıncısı Raúl Álvarez Genes olarak bilinen Auronplay‘in benzerini içeriyor; hatta Genes’in sol önkolundaki dövmeyi bile doğru yansıtıyor.
Sora, sadece Auronplay değil, aynı zamanda Pokimane olarak bilinen Imane Anys‘nin benzerine sahip bir karakter de oluşturdu.
Elbette, bazı anahtar terimlerle (örneğin “İtalyan çömlekçi oyunu”) yaratıcılığımı konuşturmam gerekti. OpenAI, Sora’nın telif hakkı korumasına sahip karakterler içeren videolar oluşturmasını önlemek amacıyla filtreler uyguladı. Örneğin, “Mortal Kombat 1 oyun görüntüleri” yazmak, bu başlıkla ilgili hiçbir şeyle karşılaşmamı sağlamadı.
Ancak denemelerim, oyun içeriğinin Sora’nın eğitim verilerine sızmış olabileceğini düşündürüyor. OpenAI, eğitim verilerini nereden aldığını gizli tutma eğiliminde. The Wall Street Journal‘a verdiği bir röportajda, OpenAI’nin eski CTO’su Mira Murati, Sora’nın YouTube, Instagram ve Facebook içeriklerinden eğitim aldığını açıkça inkar etmedi. Sora’nın teknik özelliklerinde ise, OpenAI, “halka açık” veriler ve Shutterstock gibi stok medya kütüphanelarından lisanslı verilerin kullanıldığını belirtti.
Yasal Açmazlar ve İnteraktif Oyunlar
Eğer oyun içerikleri gerçekten Sora’nın eğitim setinde yer alıyorsa, bu durumun hukuki sonuçları olabilir; özellikle OpenAI, Sora’nın üzerinde daha etkileşimli deneyimler geliştirdiğinde.
Joshua Weigensberg, Pryor Cashman’da bir fikri mülkiyet avukatı olarak, “Oyunların oynanışlarından lisanssız görüntüler alan şirketler birçok riskle karşı karşıya kalıyor.” dedi. “Bir yapay zeka modelini eğitmek genellikle eğitim verilerini kopyalamayı içeriyor. Eğer o veriler video oyunlarının oynanışlarıysa, eğitim setinde telif hakkı ile korunan materyallerin bulunma olasılığı oldukça yüksektir.”
Üstelik, yapay zeka modelleri olasılıksal modellere dayanıyor. Nin yüzlerce veri ile eğitilerek, bu verilerdeki örüntüleri öğrenerek, örneğin bir kişinin hamburger ısırdığında ne olacağını öngörebiliyor.
Bu, belirli durumlarda faydalı bir özellikken, aynı zamanda bir zayıflık da olabilir. Modeller, kamuya açık web verileriyle eğitildiğinde bazı belirli girdi türlerinde, eğitim örneklerinin neredeyse kopyalarını üretebiliyor.
Bu durum, eserlerinin izinsiz bir şekilde bu eğitimlerde kullanıldığını düşünen yaratıcıların tepkisini çekmeye başladı. Giderek artan sayıda yaratıcı, hakları konusunda dava açmak için mahkemeye başvurmakta.
Özellikle OpenAI ve Microsoft, yapay zeka araçlarının lisanslı kodları tekrarlamakla suçlandığı bir davayla karşı karşıya. Üç farklı şirket, popüler yapay zeka sanat uygulamaları Midjourney, Runway ve Stability AI‘ye karşı, sanatçıların haklarını ihlal etmekle suçlanmaktadır. Aynı zamanda büyük müzik şirketleri de Udio ve Suno gibi yapay zeka destekli şarkı üreticilerine dava açtı.
Birçok yapay zeka şirketi, bu tür durumları kapsayan indirim sözleşmeleri bulunduğunu iddia ediyor. Ancak bu sözleşmeler genellikle belirli kısıtlamalar içeriyor; örneğin, OpenAI’nin sözleşmesi yalnızca kurumsal müşterilere uygulanıyor, bireysel kullanıcılara değil.
Yasal sorunların yanı sıra, marka hakkı ihlali riski de var. “Çıktı, pazarlama ve marka ile ilişkilendirilmiş varlıkları içerebilir – bu da tanınabilir karakterlerin kullanılma riski taşır.” diyor Weigensberg.
Ayrıca, dünya modelleri ile artan ilgi, meseleleri daha da karmaşık hale getirebilir. Dünya modellerinin bir uygulaması, temelde video oyunlarını gerçek zamanlı olarak yaratmaktır. Eğer bu “sahte” oyunlar, modelin eğitildiği içeriğe benziyorsa, bu durum hukuki olarak sorun oluşturabilir.
Sonuç olarak, Sora’nın eğitim verisi olarak kullanılan oyun içerikleri, pek çok fikri mülkiyet sahibinin dikkatini çekebilir. İlgili mahkemeler, özellikle bu verilerin doğru bir şekilde lisanslanıp lisanslanmadığına dair sözleşmeleri dikkate alabilir. Bu durum, yalnızca yapay zeka endüstrisini değil, aynı zamanda video oyunu dünyasını da etkileyebilir.