Meta Llama API, OpenAI’den 18 kat daha hızlı ve 2,600 token/saniye

Günlük ve haftalık bültenlerimize katılarak endüstri lideri AI haberleri hakkında en son güncellemeleri ve özel içerikleri alın. Daha fazlasını öğrenin.

Meta, bugün Cerebras Systems ile yeni Llama API’sini güçlendirmek için bir ortaklık duyurdu. Bu ortaklık sayesinde geliştiricilere, geleneksel GPU tabanlı çözümlerden 18 kat daha hızlı çıkarım hızı sunulacak.

Bu duyuru, Meta’nın Menlo Park’taki ilk LlamaCon geliştirici konferansında yapıldı ve şirketi, OpenAI, Anthropic ve Google ile hızla büyüyen AI çıkarım hizmeti pazarında doğrudan rekabet etme konumuna getirdi. Geliştiriciler, bu hizmeti kullanarak uygulamalarını güçlendirmek için milyarlarca token satın alacaklar.

Hızın Gücü: Cerebras’ın Performans Artışı

Meta’nın sunduğu bu hizmet, Cerebras’ın özel AI çiplerinin sağladığı hızlı performans ile öne çıkıyor. Cerebras sistemi, Llama 4 Scout için saniyede 2,600 token işlem gerçekleştirebilirken, rakipleri ChatGPT için yaklaşık 130, DeepSeek için ise yalnızca 25 token işlem yapabiliyor.

“Cerebras ile iş birliği, Meta’nın geliştiricilere sunması gereken ultra hızlı çıkarımı sağlamak için seçtiği bir adımdır”, diye belirtti Cerebras’ın Pazarlama Müdürü Julie Shin Choi. “Biz Cerebras olarak bu ortaklığımızdan büyük heyecan duyuyoruz.”

Ücretsiz Dönüşüm: Açık Kaynaktan Ticari Hizmete

Llama API’si, Meta’nın AI stratejisinde önemli bir değişimi temsil ediyor. Şirket, popüler açık kaynaklı Llama modellerini bir ticari hizmete dönüştürerek AI işlem gücü satışı yapmaya başlamış oldu. Bu sayede Meta, yatırımlarından elde edeceği bir gelir akışı oluştururken, açık model taahhüdünü de sürdürüyor.

“Meta artık token satışı yapma işine girdi ve bu, Amerikan AI ekosistemi için harika bir gelişme,” diye ekledi Cerebras’tan James Wang. “Yüksek veri merkezi kapasiteleri ve 3 milyar kullanıcı ile Meta, AI ekosisteminde benzersiz bir konumda.”

Geliştiriciler Nasıl Erişebilir?

Llama API’si, şu anda sınırlı bir önizleme olarak sunulmakta ve Meta’nın ultra hızlı Llama 4 çıkarımına erişmek isteyen geliştiriciler, Llama API içinde Cerebras seçeneğini belirleyerek erken erişim talep edebilirler.

“Geliştiriciler, Meta’nın standart yazılım SDK’sında sadece iki butona tıklayarak Cerebras seçeneğini işaretleyebilir ve token’larının dev bir wafer-scale motor üzerinden işlenmesini sağlayabilir.” Wang, bu durumun Cerebras için büyük bir fırsat olduğunu vurguladı.

Meta’nın, hızın ve verimliliğin ön plana çıktığı bir AI geleceğine girdiği açıktır. Bu, sadece modellerin ne bildiği değil, aynı zamanda ne kadar hızlı düşündüğüdür. Böylece, hız sadece bir özellik değil, temel bir gereklilik haline geliyor.

VB Daily ile iş durumları hakkında günlük içgörüler

Eğer patronunuzu etkilemek istiyorsanız, VB Daily size yardımcı olur. Regülasyon değişimlerinden pratik uygulamalara kadar, jeneratif AI ile ilgili yapılan çalışmaların iç yüzünü sunarak maksimum ROI için içgörüler paylaşıyoruz.

Gizlilik Politikamızı okuyun

Abone olduğunuz için teşekkürler. Daha fazla VB bülteni için burayı kontrol edin.

Bir hata oluştu.