Hugging Face, daha az hesaplama kaynağı gerektiren ancak etkileyici performans sağlayan yeni bir dil modeli ailesi olan SmolLM2‘yi piyasaya sürdü.
Apache 2.0 lisansı altında yayımlanan bu yeni modeller, 135M, 360M ve 1.7B parametre boyutlarında mevcuttur. Bu modeller, işlemci gücü ve bellek açısından sınırlı olan akıllı telefonlar ve diğer kenar cihazlarda kullanılmak üzere idealdir. Özellikle, 1.7B parametre boyutundaki model, Meta’nın Llama 1B modelini birkaç kilit ölçütte geride bırakmaktadır.
Küçük Modeller AI Performans Testlerinde Güçlü Sonuçlar Veriyor
“SmolLM2, önceki versiyonuna göre özellikle talimat izleme, bilgi, akıl yürütme ve matematik alanlarında önemli gelişmeler gösteriyor.” Hugging Face’in model belgelerine göre, en büyük varyant, FineWeb-Edu ve özel matematik ve kodlama veri setlerini içeren çeşitli veri setleri kombinasyonu kullanılarak 11 trilyon jeton üzerinde eğitilmiştir.
Kenar Bilgişlem Mobil Cihazlara Taşındıkça Güçleniyor
SmolLM2’nin performansı boyutları göz önüne alındığında son derece etkileyicidir. 1.7B model, sohbet yeteneklerini ölçen MT-Bench değerlendirmesinde 6.13 puan elde ederek çok daha büyük modellerle rekabet eder hale gelmiştir. Ayrıca, matematiksel akıl yürütme görevlerinde de güçlü performans sergileyerek GSM8K benchmark testinde 48.2 puan almıştır.
Etkin ve Hafif Modeller Endüstri Devlerine Meydan Okuyor
Ancak, bu daha küçük modellerin de sınırlamaları bulunmaktadır. Hugging Face’in belgelerine göre, bunlar genellikle İngilizce’de içerik anlama ve üretme yeteneğine sahiptir ve her zaman doğrulanabilir veya mantıklı bir çıktı üretmeyebilir.
SmolLM2’nin piyasaya sürülmesi, AI’nın geleceğinin yalnızca giderek daha büyük modellere değil, daha az kaynakla güçlü performans sergileyebilen daha verimli mimarilere ait olabileceğini göstermektedir. Bu durum, AI erişiminin demokratikleştirilmesi ve AI uygulamalarının çevresel etkisinin azaltılması açısından önemli sonuçlar doğurabilir.
Modeller, her boyut varyantı için baz ve talimat odaklı versiyonlarla birlikte Hugging Face model hubi üzerinden hemen kullanıma sunulmuştur.