Yeni Nesil Küçük Dil Modelleri
Büyük dil modelleri (LLM’ler) her sektörde yaygınlaşarak teknolojinin potansiyelini değiştirdi. Ancak, bu modellerin boyutları nedeniyle birçok şirket için pratik değildir. Bu durumu aşmak için küçük dil modelleri (SLM), daha az kaynak tüketen, belirli alanlara odaklanan ve daha basit sinir mimarileriyle inşa edilen modeller olarak öne çıkıyor.
Yeni Modellerin Tanıtımı
Microsoft, Phi serisine yeni ve ilginç iki küçük dil modelini ekledi: Phi-4-mini ve Phi-4-multimodal.
- Phi-4-mini
- Phi-4-multimodal
Özellikle Phi-4-multimodal, metin, ses ve görüntü verilerini işleyebilen ilk çok modlu model olarak dikkat çekiyor. Bu modeller, cihaz üzerinde dağıtım için yeterince küçüktür ve bu sayede gizlilik ve uyum gereksinimlerine de uygunluk sağlayabilir.
Küçük Dil Modellerinin Avantajları
SLM’ler, bellek ve hesaplama kısıtlı ortamlarda üretken yapay zeka yeteneklerini etkinleştirir. Örneğin, SLM’ler doğrudan akıllı telefonlar ve çeşitli son kullanıcı cihazlarına dağıtılabilir. Bu on-device dağıtım, düzenleyici gereksinimlere uyması gereken kullanımlarda gizliliği artırabilir.
SLM’lerin diğer avantajları arasında, benzer kalitedeki büyük dil modellerine göre daha düşük gecikme süresi ve daha hızlı çıkarım süresi yer alır. Ayrıca, SLM’ler eğitim verilerine bağlı olarak özel görevlerde daha iyi performans sergileyebilirken, genel amaçlı uygulamalar için retrieval-augmented generation (RAG) ya da yerel fonksiyon çağrımaları kullanılması önerilir.
Phi-4-multimodal ve Performansı
Phi-4-multimodal, 5.6 milyar parametreye sahip olup ses, görüntü ve metin akıl yürütmesi yapabilmektedir. Bu özellikleri sayesinde otomatik konuşma tanıma (ASR), çok modlu özetleme, çeviri, metin tanıma (OCR) ve görsel akıl yürütme gibi kullanımları desteklemektedir. Model, 21 gün boyunca 512 NVIDIA A100-80GB GPU üzerinde eğitilmiştir.
ASR alanında en iyi performansı göstererek, Huggingface OpenASR liderlik tablosu‘nda 6.14% kelime hatası oranı ile birinci sırada yer almaktadır. Kelime hatası oranı (WER), konuşma tanıma performansını değerlendirmek için yaygın olarak kullanılan bir ölçümdür ve yanlış yazılan kelimelerin oranını belirler.
Phi-4-mini Hakkında Bilgi
Phi-4-mini, yalnızca metin işleyen, 3.8 milyar parametreye sahip yoğun, yalnızca kodlayıcı bir Transformer modelidir. Bu model 128K token uzunluğunda bir uzun bağlam penceresine sahiptir ve chat için optimize edilmiştir. Model, 14 gün süresince 1024 NVIDIA A100 80GB GPU üzerinde eğitilmiştir.
Her iki model için de eğitim verileri, yüksek kaliteli eğitim materyalleri ve kodlarla sınırlı olarak seçilmiştir, bu da onları ders kitabı kalitesinde hale getirmiştir.
Açık Kaynak Topluluğuna Katkı
NVIDIA, açık kaynak ekosistemine aktif olarak katkıda bulunmakta ve yüzlerce projeyi açık kaynak lisansları altında yayınlamaktadır. Şirket, AI şeffaflığını artırmaya ve kullanıcıların yapay zeka güvenliği ve dayanıklılığını geniş çapta paylaşmalarını sağlamaya kararlıdır.
NVIDIA NeMo platformu kullanılarak, bu açık modeller kullanıcıların özel verileri üzerinde özelleştirilerek her sektörde çeşitli yapay zeka iş akışları için yüksek verimlilikte uyarlanabilir.
NVIDIA ve Microsoft arasındaki uzun süredir devam eden işbirliği, Azure üzerinde GPU yeniliklerini, PC geliştiricileri için NVIDIA RTX GPU’larındaki entegrasyonları ve optimizasyonları kapsamaktadır. Bu işbirliği, üretken yapay zeka, sağlık ve yaşam bilimleri gibi geniş alanları kapsamaktadır.
Bugün Başlayın!
Verilerinizi getirin ve NVIDIA hızlandırmalı platformda Phi-4’ü deneyin. build.nvidia.com/microsoft adresinden, Phi-4-multimodal için metin, görüntü ve ses ile deney yapabilir ve örnek araç çağrımalarını görebilirsiniz.