SON DAKİKA

İş Dünyası

Mistral Small 3 ile Açık Kaynak AI Daha Küçük, Hızlı ve Uygun Fiyatlı

Günlük ve haftalık bültenlerimize katılın, sektörde öncü AI haberleri için en son güncellemeleri ve özel içerikleri alın. Daha fazla bilgi edinin.


Mistral AI, hızla yükselen bir Avrupa yapay zeka girişimi, bugün, bilgisayar maliyetlerini önemli ölçüde azaltırken, üç katı büyüklüğündeki modellerle eşleştiğini iddia ettiği yeni bir dil modeli tanıttı — bu gelişme, gelişmiş AI dağıtımının ekonomisini yeniden şekillendirebilir.

Yeni Model: Mistral Small 3

Yeni model, Mistral Small 3, 24 milyar parametreye sahip ve standart ölçeklerde %81 doğruluk oranı sağlıyor. Aynı zamanda saniyede 150 token işleyebiliyor. Şirket, bu modeli Apache 2.0 lisansı altında yayınlayarak, işletmelerin onu özgürce değiştirmesini ve dağıtmasını sağlıyor.

Verimlilik ve Performans

“Biz, 70 milyar parametre altındaki tüm modeller arasında bu modelin en iyi olduğunu düşünüyoruz,” diyor Mistral’ın baş bilim adamı Guillaume Lample, VentureBeat’e verdiği özel bir röportajda. “Bu modelin, birkaç ay önce çıkarılan Meta’nın Llama 3.3 70B modeli ile eşdeğer olduğunu tahmin ediyoruz.”

Bu açıklama, bir Çin girişimi olan DeepSeek’in, sadece 5.6 milyon dolara rekabetçi bir model eğittiğini iddia etmesinin ardından geliyor; bu iddia, yatırımcıların ABD teknoloji şirketlerinin büyük yatırımlarını sorgulamasıyla Nvidia’nın piyasa değerinden neredeyse 600 milyar dolar kaybetmesine neden oldu.

Veri Kullanımı ve Eğitim Yöntemleri

Mistral’ın yaklaşımı, ölçekten ziyade verimliliğe odaklanıyor. Şirket, performans artırımlarını çoğunlukla geliştirilmiş eğitim teknikleri ile elde etti, daha fazla hesaplama gücüyle değil.

“Değişen şey, esasen eğitim optimizasyon teknikleriydi,” diyor Lample. “Modeli eğitim şeklimiz çok farklıydı, ağırlıkları değiştirme yöntemi farklıydı.” Model, karşılaştırılabilir modellere kıyasla yalnızca 8 trilyon token ile eğitildi. Bu verimlilik, maliyetler nedeniyle endişe duyan işletmeler için gelişmiş AI yeteneklerini daha erişilebilir hale getirebilir.

Özellikle, Mistral Small 3, pek çok rakibin kullandığı pekiştirmeli öğrenme veya sentetik eğitim verisi teknikleri olmadan geliştirilmiştir. Lample, bu “ham” yaklaşımın, daha sonra tespit edilmesi zor istenmeyen önyargılar yerleştirmemeyi sağladığını belirtiyor.

Küçük Modeller ve İşletmelerin Tercihleri

Model, gizlilik ve güvenilirlik gerekçeleriyle yerinde dağıtım gereksinimi olan işletmelere özellikle hitap ediyor; bu, finansal hizmetler, sağlık hizmetleri ve imalat şirketlerini içeriyor. Tek bir GPU üzerinde çalışabiliyor ve tipik iş kullanım durumlarının %80-90’ını yönetebiliyor.

“Pek çok müşterimiz, bu yerinde çözümü gizliliği önemsediği için tercih ediyor,” diyor Lample. “Kritik bir hizmetin, kendilerinin tamamen kontrol edemediği şeylere güvenmesini istemiyorlar.”

Açık Kaynak ve Gelecek Beklentileri

Bu çıkış, Mistral’ı 6 milyar dolar değerlemeye sahip bir şirket olarak, küresel AI yarışında Avrupa’nın şampiyonu haline getiriyor. Şirket, Microsoft’tan yatırım aldı ve bir IPO’ya doğru ilerliyor, diyor CEO Arthur Mensch.

Sektör gözlemcileri, Mistral’ın daha küçük, daha verimli modellere odaklanmasının, AI endüstrisi olgunlaştıkça öngörülebilir olabileceğini belirtiyor. Bu yaklaşım, daha büyük ve daha pahalı modeller geliştiren OpenAI ve Anthropic gibi şirketlerle kontrast oluşturuyor.

“2024’te yaşadığımız şeyi muhtemelen daha fazla göreceğiz; yani, çok sayıda açık kaynak model ile çok fazla uygun lisansla beraber,” diyor Lample. “Bu modelin bir tür emtia haline gelmesi çok olası.”

Mistral, önümüzdeki haftalarda geliştirilmiş akıl yürütme yetenekleri olan ek modelleri piyasaya sürmeye planlıyor ve bu da verimlilik odaklı yaklaşımının, çok daha büyük sistemlerin yetenekleriyle eşleşip eşleşmeyeceği üzerinde ilginç bir test oluşturacak.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri