Küçük Model, Büyük Etki: Patronus AI’nin Glider’ı GPT-4’ü Geçti

Günlük ve haftalık haber bültenlerimize katılarak sektördeki en son güncellemeleri ve özel içerikleri alın. Daha fazla bilgi edinin.

Eski Meta AI araştırmacıları tarafından kurulan bir girişim, büyük modellerle aynı etkinliği gösteren ve kararları için detaylı açıklamalar sunan hafif bir yapay zeka modeli geliştirdi.

Patronus AI, Glider adlı, açık kaynak kodlu 3.8 milyar parametreli dil modelini bugün piyasaya sürdü. Bu model, yapay zeka çıktılarının değerlendirilmesinde OpenAI’ın GPT-4o-mini’sinden birkaç önemli ölçüde daha iyi performans gösteriyor. Model, AI sistemlerinin cevaplarını yüzlerce farklı kriter üzerinde değerlendiren ve mantığını açıklayan bir otomatik değerlendirici olarak tasarlandı.

Güçlü Değerlendirme: Glider’ın Gücü

Bu geliştirme, yapay zeka değerlendirme teknolojisinde önemli bir atılımı temsil ediyor. Çoğu firma, AI sistemlerini değerlendirmek için büyük, özel modellere, örneğin GPT-4’e bel bağlayarak, bunun maliyet açısından zorlayıcı ve belirsiz olmasına neden oluyor. Glider, daha küçük boyutu sayesinde daha ekonomiktir ve ayrıca kararları için madde madde açıklamalar sunarak, hangi unsurların kararını etkilediğini belirtiyor.

Gerçek Zamanlı Değerlendirme: Hız ve Doğruluk

Bu model, daha küçük dil modellerinin, belirli görevlerde çok daha büyük olanların yeteneklerini aşabileceğini veya onlarla eşleşebileceğini kanıtlıyor. Glider, boyutunun 17 katı olan modellere benzer performans sergileyerek sadece bir saniyelik gecikme ile çalışıyor. Bu, şirketlerin yapay zeka çıktıları oluşurken bunları değerlendirebilmeleri için pratik hale getiriyor.

Gizlilik Önceliği: Yerel Donanımda AI Değerlendirmesi

AI sistemleri geliştiren şirketlere birçok pratik avantaj sunan Glider’ın küçük boyutu, bireysel donanımlar üzerinde çalışmasına olanak tanıyarak, verilerin dış API’lere gönderilmesi konusundaki gizlilik endişelerini gidermektedir. Açık kaynak yapısı, organizasyonların kendi altyapılarına uygulamalarını ve özel ihtiyaçlarına göre özelleştirmelerini sağlıyor.

Model, 685 farklı alanda 183 farklı değerlendirme metriği üzerine eğitilmiş olup, doğruluk ve tutarlılık gibi temel unsurlardan, yaratıcılık ve etik gibi daha ince noktalara kadar geniş bir yelpazede değerlere sahiptir. Bu geniş eğitim, çok sayıda farklı değerlendirme görevine genelleme yapmasına yardımcı olmaktadır.

“Müşterilerin yerel modellere ihtiyacı var çünkü özel verilerini OpenAI veya Anthropic’a gönderemezler,” diye açıkladı Deshpande. “Ayrıca küçük dil modellerinin etkili değerlendiriciler olabileceğini göstermek istiyoruz.”

Glider’ın piyasaya sürülmesi, şirketlerin sağlam değerlendirme ve gözetim yoluyla sorumlu AI geliştirmeye odaklandığı bir dönemde gerçekleşti. Detaylı açıklamalar sunma yeteneği, organizasyonların AI sistemlerinin davranışlarını daha iyi anlamalarına ve geliştirmelerine yardımcı olabilir.

Patronus AI, yapay zeka değerlendirme teknolojisinde kendisini bir lider olarak konumlandırmıştır. Şirket, büyük dil modellerinin otomatik test ve güvenliğini sağlamak için bir platform sunmakta olup, Glider, gelişmiş AI değerlendirmesini daha erişilebilir hale getirmenin en son adımıdır.

“Henüz başlangıçtayız,” diyor Kannappan. “Zamanla, daha fazla geliştirici ve şirketin bu alanlarda sınırları zorlayacağını bekliyoruz.”

Glider’in geliştirilmesi, AI sistemlerinin geleceğinin her zaman daha büyük modellere ihtiyaç duymayabileceğini, ancak belirli görevler için optimize edilmiş daha özel ve etkili modellere odaklanabileceğini göstermektedir. Daha büyük modellerin performansıyla eşleşirken daha iyi şeffaflık sunması, şirketlerin AI değerlendirme ve geliştirme yaklaşımlarını etkileyebilir.

VB Daily ile iş kullanımları hakkında günlük içgörüler

Patronus AI, yapay zeka, düzenleyici değişiklikler ve pratik uygulamalar hakkında bilgi alırken patronunuzu etkilemek için VB Daily burada.

Gizlilik Politikamızı okuyun.

Abone olduğunuz için teşekkür ederiz. Diğer VB haber bültenlerine buradan göz atın.

Bir hata oluştu.