Yapay zeka geliştirmek ve işletmek giderek daha pahalı hale geliyor. OpenAI’nin AI operasyon maliyetlerinin bu yıl 7 milyar dolara ulaşabileceği öngörülürken, Anthropic’in CEO’su yeni modellerin 10 milyar dolardan fazla isteyebileceği konusunda uyarıda bulundu.
Bu nedenle, yapay zekayı daha uygun maliyetli hale getirme yolları arayışları hız kazanmış durumda.
Bazı araştırmacılar mevcut model mimarilerini optimize etme teknikleri üzerinde çalışırken, diğerleri ise daha uygun maliyetle ölçeklenebileceğine inandıkları yeni mimariler geliştirmekte.
Akademik Temel
Karan Goel, Cartesia adlı girişiminin ortak kurucu olarak bulunduğu bu grupta, ileride çok daha verimli olan durum uzay modelleri (SSM) üzerinde çalışmakta.
Goel, Stanford Üniversitesi’nin AI laboratuvarında doktora adayıyken Christopher Ré gibi önemli isimler altında eğitim aldı. Burada Albert Gu ile tanıştı ve birlikte SSM’lerin temellerini attılar.
Goel, “Gerçekten faydalı yapay zeka modelleri geliştirmek için yeni model mimarilerine ihtiyaç var.” diyerek durumun ciddiyetini vurguladı.
SSM’ler ve Dönüştürücüler
Günümüzdeki birçok yapay zeka uygulaması, ChatGPT ve Sora gibi, dönüşüm mimarisiyle çalışan modellerden oluşmakta. Dönüştürücü, işlem sırasında verileri işlerken bir gizli durum oluşturur ve bu, onun hatırlama yeteneğini sağlar.
SSM’ler, önceki tüm veri noktalarını sıkıştırarak daha verimli bir hafıza yöntemi sunuyor. Yeni veriler geldikçe, modelin “durumu” güncellenmekte ve önceki verilerin çoğu atılmakta.
Sonuç olarak, SSM’ler büyük miktarda veriyi yönetebiliyor ve belirli veri üretim görevlerinde dönüşümcülere göre daha iyi performans gösterebiliyor. Artan inference maliyetleri göz önüne alındığında, bu oldukça cazip bir durum.
Etik Endişeler
Cartesia, dış organizasyonlarla ve kendi iç ekipleriyle iş birliği yapan bir araştırma merkezi gibi işliyor. Şirketin en yeni projesi Sonic, bir kişinin sesini kopyalama veya yeni bir ses üretme yeteneğine sahip olan bir SSM.
Ancak, Cartesia yaratıcısının karşılaştığı etik problemlerden kaçamadı. Şirket, bazı SSM’lerini The Pile adlı, izinsiz telif hakkına sahip kitaplar içeren bir açık veri seti üzerinde eğitti.
Goel, “Ses klonlama aracıyla ilgili moderasyon sorunları üzerinde çalışıyoruz,” diyerek bu sorunun üstesinden gelmek için sistemler geliştirdiklerini belirtti.
Cartesia’nın Sonic modeli, API ve web paneli aracılığıyla sunulmakta ve ses klonlama işlemini kolaylaştırıyor. Sonic, incelediği veri üzerinde yüksek performans sağlamakta.
Lepenk Düz İş Dünyası
Goel, Sonic API erişimi için “yüzlerce” müşterilerinin bulunduğunu ifade etti. Cartesia’nın API’sı, 100.000 karaktere kadar ücretsiz sunulmakta, bu süreyi aşan en pahalı paket ise ayda 299 dolara 8 milyon karakter sunmakta.
Cartesia, kullanıcı verilerini model eğitimi için kullandığını belirtiyor. Ancak gizlilik kaygısı olan kullanıcılar için verilerini istemedikleri takdirde kullanmamaları için bir seçenek sunmakta.
Bugün Sonic, oyun, ses dublajı ve daha birçok alanda kullanılmakta. Goel, SSM’lerin potansiyelinin henüz tam olarak keşfedilmediğini düşünüyor.
Cartesia’nın uzun vadeli vizyonu, her cihazda çalışan çok modlu temel modeller geliştirmek. Goel, “Hedefimiz, gerçek zamanlı zeka oluşturarak büyük bağlamlarda akıllı hale gelmek.” dedi.
Şirket son dönemlerde, Index Ventures’ın liderliğinde 22 milyon dolarlık yeni bir yatırım aldı.
Shardul Shah, Cartesia’nın teknolojisinin gelecekte müşteri hizmetleri, satış, pazarlama ve güvenlik uygulamalarını yönlendirebileceğini öngörüyor.
TechCrunch, yapay zeka odaklı bir haber bülteni yayınlıyor! Her Çarşamba gelen kutunuza ulaşmak için buradan abone olabilirsiniz.