SON DAKİKA

TV & Medya

Stability AI, akıllı telefonlarda çalışabilen ses oluşturma modeli sundu.

Stability AI’dan Yeni Ses Üretim Modeli

Yapay zeka alanında faaliyet gösteren Stability AI, Stable Audio Open Small adlı yeni bir “stereo” ses üreten yapay zeka modelini duyurdu. Şirket, bu modelin piyasadaki en hızlı ve akıllı telefonlarda çalıştırılabilecek kadar verimli olduğunu öne sürüyor.

Üretimde İş Birliği

Stable Audio Open Small, Stability AI ile mobil cihazların içinde bulunan birçok işlemciyi üreten Arm arasında gerçekleştirilen bir iş birliğinin sonucunda ortaya çıktı. Şu anda piyasa da mevcut olan birçok yapay zeka destekli uygulama, ses üretebiliyor. Ancak çoğu, veri işlemek için bulut tabanlı sistemlere dayanıyor; bu da, çevrimdışı kullanım imkanı sunmuyor.

Stability AI, modelin eğitim setinin Free Music Archive ve Freesound gibi telif hakkı içermeyen müzik kütüphanelerinden oluştuğunu iddia ediyor. Bu, Suno ve Udio gibi rakiplerinin aksine, böylesi bir risk taşımadığını vurguluyor.

Modelin Özellikleri

Stable Audio Open Small, 341 milyon parametreye sahip ve Arm işlemcileri üzerinde optimize edilmiş durumda. Bu parametreler, modelin davranışını yönlendiren iç bileşenlerdir. Model, kısa ses örnekleri ve ses efektleri (örneğin, davul ve enstrüman riffleri gibi) hızlı bir şekilde üretebiliyor. Stability AI, modelin bir akıllı telefon üzerinde 8 saniyeden kısa bir sürede 11 saniyeye kadar ses üretme kapasitesine sahip olduğunu belirtiyor.

İşte Stable Audio Open Small ile üretilen bir örnek:

Ve başka bir örnek:

Sınırlamalar ve Kullanım Koşulları

Ancak modelin bazı sınırlamaları bulunuyor. Stable Audio Open Small, yalnızca İngilizce yazılmış komutları destekliyor. Stability’nin belgelerine göre, model gerçekçi vokaller veya yüksek kaliteli şarkılar üretemiyor. Ayrıca, Stability, modelin müzik tarzları arasında eşit performans göstermediğini belirtiyor; bu, modelin batı merkezli eğitim verilerinin bir sonucu olarak düşünülebilir.

Geliştiriciler için bir başka ayrıntı, Stable Audio Open Small‘ın kullanım şartlarının biraz kısıtlayıcı olması. Araştırmacılar, hobi sahipleri ve yıllık geliri 1 milyon dolardan az olan işletmeler için ücretsiz olarak kullanılabiliyor. Ancak, yıllık geliri 1 milyon doları aşan geliştiriciler ve kuruluşlar Stability’nin kurumsal lisansını satın almak zorundalar.

Gelecek Vizyonu

Stability AI, popüler görüntü üretim modeli Stable Diffusion‘ın geliştiricisi olarak dikkat çekiyor. Geçtiğimiz yıl, Eric Schmidt ve Napster kurucusu Sean Parker gibi yatırımcıların desteğiyle yeni fonlar topladı. Ancak, Emad Mostaque’ın yönetim döneminde firmada önemli problemler yaşandı. Mali sorunlar, çalışanların istifası ve iş ortaklıklarının sona ermesi gibi sonuçlar doğurdu.

Son birkaç ayda Stability AI, yeni bir CEO atadı, ünlü yönetmen James Cameronı yönetim kuruluna kattı ve birçok yeni görüntü üretim modeli sundu.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri