SON DAKİKA

Yapay Zeka

Hybrid AI Modelı Saniyeler İçinde Pürüzsüz, Yüksek Kaliteli Videolar Oluşturuyor

Yapay Zeka ile Hızlı Video Üretimi

Yapay zeka modelinin arka planda nasıl çalıştığını düşünmek, durmaksızın yapılan bir animasyon süreci olduğunu düşündürebilir; ama bu, OpenAI’nin SORA ve Google’ın VEO 2 gibi “difüzyon modelleri” için doğru değil.

Difüzyon sistemleri, videoları her bir kareyi ayrı ayrı üretmek yerine (ya da “autoregressively” olarak), tüm sekansı bir arada işler. Bu da genellikle fotogerçekçi bir klip ortaya çıkarır, ancak süreç yavaş ve anlık değişikliklere izin vermez. Ancak, MIT’nin Bilgisayar Bilimleri ve Yapay Zeka Laboratuvarı (CSAIL) ve Adobe Araştırma ekibi, saniyeler içinde video oluşturan yeni bir yaklaşım geliştirdi: “CausVid.”

Hızlı ve Etkileşimli İçerik Üretimi

CausVid, bir tam sıra difüzyon modelinin, yüksek kaliteli ve tutarlı bir şekilde gelecek kareyi hızlıca tahmin etmesini sağlamak için bir autoregresif sistemi eğittiği bir “öğrenci” modeli olarak düşünülüyor. Bu, kullanıcıların basit bir metin istemiyle sahneler yaratmasına olanak tanıyor; örneğin bir fotoğrafı hareketli bir sahneye dönüştürmek, bir videoyu uzatmak veya oluşturulan sahneyi yeni girdilerle değiştirmek mümkün hale geliyor.

Dinamik yapısı sayesinde, CausVid, 50 adımlık bir süreci yalnızca birkaç eyleme indiriyor. Kullanıcılar “yolda yürüyen bir adam üret” gibi bir istemde bulunabilir ve ardından “karşı kaldırımda not defterine yazıyor” gibi yeni öğeler ekleyerek sahneyi zenginleştirebilir.

Hata Toleransı ve Kalite

CSAIL araştırmacıları, CausVid’in farklı video düzenleme görevlerinde kullanılabileceğini belirtiyor. Örneğin, bir canlı yayını başka bir dilde anlamak için sesi senkronize eden videolar üretebilir ya da video oyunlarında yeni içerikler oluşturabilir.

CausVid’in başarısını, difüzyon bazlı modelin ve metin üretiminde yaygın olan autoregresif mimarinin birleşiminde bulan Tianwei Yin, “Bu AI destekli öğretici model, gelecekteki adımları öngörerek bir kareler dizi sistemini eğitiyor ve böylece hata oranını azaltıyor.” diyor.

CausVid, 10 saniye uzunluğundaki yüksek çözünürlüklü videoları başarılı bir şekilde oluşturdu. Açık kaynaklı OpenSORA ve MovieGen benzerlerine kıyasla, 100 kat daha hızlı çalıştı ve yüksek kaliteli klipler üretti. Ayrıca, kullanıcıların CausVid’in öğrenci modelinin ürettiği videoları, difüzyon bazlı öğreticiden daha çok beğendiği tespit edildi.

Sonuç olarak, CausVid, AI video üretiminde verimli bir adım olarak öne çıkıyor ve bu yeni hibrit sistem, gecikmeleri azaltarak, akış hızını artırıyor ve daha etkileşimli uygulamalara olanak tanıyor.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri

The economics of AI refer to the economic impact and implications of artificial intelligence technologies. Some key points to know about the economics of AI include: 1. Increased productivity: AI has the potential to significantly increase productivity by automating routine tasks and processes, freeing up human workers to focus on more complex and creative tasks. 2. Job displacement: While AI can create new job opportunities, it also has the potential to displace certain roles that can be automated. This can lead to job loss and require workers to acquire new skills to remain relevant in the workforce. 3. Cost savings: AI can help businesses reduce costs by streamlining operations, improving efficiency, and optimizing resource allocation. 4. Enhanced decision-making: AI can provide businesses with valuable insights and data analysis to make more informed and strategic decisions, leading to better outcomes and competitive advantage. 5. New revenue streams: AI technologies can enable businesses to develop new products and services, enter new markets, and create innovative business models that can generate additional revenue streams. 6. Ethical and societal considerations: The widespread adoption of AI raises ethical and societal concerns around issues such as privacy, bias, job displacement, and the potential for AI to exacerbate existing inequalities. 7. Regulatory challenges: Policymakers are grappling with how to regulate AI technologies to ensure they are used responsibly and ethically while also fostering innovation and economic growth. Overall, the economics of AI present both opportunities and challenges for businesses, workers, and society as a whole. It is important for stakeholders to carefully consider the implications of AI adoption and to develop strategies for maximizing the benefits while mitigating potential risks.