Nvidia’nın Yeni Girişimi: Cosmos World Foundation Modelleri
Nvidia, insanların doğal olarak geliştirdiği dünyaya ait zihinsel modellerden esinlenen yeni yapay zeka (YZ) modellerine adım atıyor.
Özgür Kullanıma Sunulan Modeller
CES 2025’te Las Vegas’ta yapılan açıklamayla, şirket, “fizik bilincine sahip” videoları tahmin ve üretim yapabilen bir model ailesini özgürce erişilebilir hale getirdiğini duyurdu. Bu aileye, Cosmos World Foundation Models veya kısaca Cosmos WFM deniyor.
Bu modeller, belirli uygulamalar için özelleştirilebilen bir yapıda olup, Nvidia’nın API ve NGC kataloglarından, GitHub’dan ve Hugging Face gibi yapay zeka geliştirici platformlarından erişilebilir.
Üç Farklı Model Kategorisi
Nvidia, blog yazısında, Cosmos WFMs’nin ilk dalgasının fizik tabanlı simülasyon ve sentetik veri üretimi için erişibile olduğunu belirtti. Bu modeller, her ölçekten araştırmacı ve geliştirici tarafından, ticari kullanım izni ile birlikte serbestçe kullanılabilir.
Cosmos WFM ailesindeki modeller, üç ana kategoriye ayrılmıştır: Nano (düşük gecikme ve gerçek zamanlı uygulamalar için), Super (yüksek performanslı temel modeller) ve Ultra (maksimum kalitede çıktı) olarak tanımlanmıştır.
Modellerin parametre sayısı 4 milyar ile 14 milyar arasında değişmekte olup, Nano en küçük, Ultra ise en büyük modeldir. Genellikle, parametre sayısı bir modelin problem çözme yetenekleriyle ilişkilidir ve daha fazla parametreye sahip modellerin daha iyi performans gösterdiği kabul edilir.
Sorumlu Kullanım için İnovatif Çözümler
Cosmos WFM’in bir parçası olarak bir “upsampling modeli”, artırılmış gerçeklik için optimize edilmiş bir video kodlayıcı ve sorumlu kullanım için “koruma modelleri” sunulmaktadır. Ayrıca, otonom araç gelişimi gibi uygulamalar için duyucu veriler üretebilen ince ayar yapılmış modeller de sağlanmıştır. Bu modeller, 9,000 trilyon token (veri parçacığı) ve 20 milyon saatlik gerçek dünya insan etkileşimi, çevre, sanayi, robotik ve sürüş verileri ile eğitilmiştir.
Nvidia, bu eğitim verilerinin kaynağını açıklamamakla birlikte, bir dava iddiasında, şirketin hak sahipliği olmayan YouTube videolarını izinsiz kullandığı öne sürülmektedir.
Nvidia’nın bir temsilcisi, TechCrunch’a yaptığı açıklamada, Cosmos’un “korunan eserleri kopyalamak veya ihlal etmek için tasarlanmadığını” ifade etti. Temsilci, “Cosmos, insanların öğrendiği gibi öğreniyor” dedi. “Cosmos’un öğrenmesine yardımcı olmak için çeşitli kamu ve özel kaynaklardan veri topladık ve verinin kullanımının hem yasaların ruhuna hem de harflerine uygun olduğundan eminiz. Dünyanın işleyişini öğrenen Cosmos modellerinin öğrendiği gerçekler, kopyalanabilir veya belirli bir yazar ya da şirketin kontrolüne tabi değildir.”
Yasal Tartışmalar ve İnovatif Kullanımlar
Nvidia’nın iddialarının adalet önünde geçerliliği olup olmayacağı, adil kullanım ile ilgili yasal durumlara bağlı kalacaktır. Bu durumun, YZ eğitimi için donanım ve veri gereksinimlerini göz önünde bulundurarak dönüştürücü bir kullanım gerektirebileceği ifade edilmektedir.
Nvidia, Cosmos WFM modellerinin, metin veya video kareleri ile verildiğinde, “kontrol edilebilir, yüksek kalitede” sentetik verileri üretme kapasitesine sahip olduğunu belirtti. Cosmos’un, robot duyucu veya hareket verileri gibi çeşitli girdi biçimleriyle fizik tabanlı videolar oluşturabildiği kaydedilmektedir.
Nvidia, Waabi, Wayve, Fortellix ve Uber gibi bazı şirketlerin, video arama ve derleme ile otonom araçlar için YZ modelleri oluşturma gibi çeşitli kullanım durumları için şimdiden Cosmos WFMs’yi denemeye başladığını açıkladı.
Uber CEO’su Dara Khosrowshahi, “Üretken yapay zeka, mobilitenin geleceğini destekleyecek ve zengin veri ile çok güçlü hesaplama gerektirecek.” dedi. “Nvidia ile çalışarak, otonom sürüş çözümlerinin güvenli ve ölçeklenebilir bir zaman çizelgesini hızlandırabileceğimize inanıyoruz.” açıklamasında bulundu.
Açık Model Tanımı ve Kısıtlamalar
Nvidia’nın dünya modellerinin tam anlamıyla “açık kaynak” olmadığını da belirtmek önemlidir. Genel olarak kabul edilen bir “açık kaynak” YZ tanımına göre, bir yapay zeka modelinin, bir kişinin modeli “önemli ölçüde” tekrar yaratabilmesi için yeterli bilgi sağlaması ve eğitim verisi ile ilgili gerekli detayları açıklaması beklenir.
Nvidia, Cosmos WFM eğitim verisi ile ilgili detayları açıklamadı ve modellerin tam olarak yeniden oluşturulması için gerekli tüm araçları sunmadı. Bu nedenle, teknoloji devi modelleri “açık” olarak tanımlamayı tercih etmektedir.
Nvidia CEO’su Jensen Huang, “Cosmos’un robotik ve endüstriyel YZ dünyası için Llama’nın yaptığı şeyi yapmasını umuyoruz.” ifadeleriyle, bu yeni modellerin önemini vurguladı.