Amazon Web Services (AWS), 2024 re:Invent konferansında yeni nesil çok modlu üretken yapay zeka modelleri ailesi olan Nova‘yı tanıttı.
Nova Modelleri
Tanıtılan modeller arasında Micro, Lite, Pro ve Premier bulunmaktadır. Micro, Lite ve Pro, AWS müşterilerine hemen sunulmaya başlandı; Premier modelinin ise 2025’in başlarında piyasaya sürülmesi planlanıyor.
Nova, metin, resim ve video gibi çeşitli içerikleri işleyebilen gelişmiş modelleri ile dikkat çekiyor. Micro sadece metin alabiliyor ve metin üretebiliyor ancak en hızlı yanıt sürelerine sahip. Lite, görüntü ve video gibi çoklu girdi türlerini işleyebiliyor. Pro, hız, doğruluk ve maliyet arasında dengeli bir performans sunarken, Premier modelinin daha karmaşık iş yükleri için tasarlandığı belirtiliyor.
Nova’nın Yetenekleri
Bu modeller, belgeleri özetlemek ve grafiklerle yapılan analizleri gerçekleştirmek gibi çeşitli görevler için uygundur. Pro ve Premier modelleri ise belge ve resimleri analiz edebilme yeteneğine sahiptir. AWS, Premier modelini özel yapılandırılmış modeller oluşturmak için bir “öğretmen” modeli olarak konumlandırıyor.
Micro modelinin 128,000-token bağlam penceresi bulunmakta, bu da onu yaklaşık 100,000 kelime işleyebilecek kapasitede yapmaktadır. Lite ve Pro modellerinin bağlam penceresi ise 300,000-token‘dır. 2025’in başlarında, bazı Nova modellerinin bağlam pencereleri 2 milyon token‘ı aşacak şekilde genişletilecektir.
Multimedya Üretimi: Canvas ve Reel
Nova Canvas ve Nova Reel, AWS’nin üretken medya alanındaki en güçlü hamlesi olarak öne çıkıyor. Canvas, kullanıcıların görselleri oluşturup düzenlemelerine olanak tanırken, “arka planı kaldırma” gibi işlemleri gerçekleştirebiliyor. Reel ise, vurgulayarak referans görüntülerle veya yalnızca metin komutlarıyla altı saniyeye kadar video üretmektedir. Hedef bir görüntü oluşturmak için kamera hareketlerini ayarlayarak pan, 360 derece döndürme ve zoom gibi efektler ekleyebiliyor.
Reel modeli şu an altı saniye uzunluğunda videolar oluşturabiliyor ve yaklaşık üç dakikada bir video üretiyor. Daha uzun videoların üretilmesi ise “çok yakında” gelecek.
Jassy, Canvas ve Reel’in sorumlu kullanım için entegre kontroller içerdiğini vurguladı. Bu kontroller, zararlı içeriklerin üretilmesini sınırlamak amacı taşımaktadır.
Güvenlik ve Şeffaflık
AWS, güvenlik tedbirlerini genişlettiğini duyurarak, Nova’nın yanı sıra yanlış bilgilendirmeye karşı ek önlemler alındığını bildirdi. Ancak bu tür önlemlerin nasıl uygulanacağı konusunda kesin bilgi verilmemektedir.
Ayrıca, AWS verilerin hangi şekilde kullanıldığı konusunda oldukça belirsiz. Şirket, yalnızca kendi verileri ile lisanslı verilerin bir kombinasyonunu kullandığını belirtiyor. AWS, müşterilerine, modellerinin potansiyel olarak korunmasız içeriği tekrar üretmesi halinde karşılaşabilecekleri yasal sorunlara karşı bir tazminat politikası sunuyordu.
Jassy, Nova’nın geleceği hakkında, AWS’nin Q1 2025‘te bir sesli konuşma modeli üzerinde çalıştığını ve 2025’in ortalarında bir “her şeyden her şeye” modelinin geleceğini ekledi. Bu modelin, metin, konuşma, görüntü veya video alıp yine aynı şekilde dönüşüm gerçekleştirebileceği belirtiliyor.