SON DAKİKA

İş Dünyası

AI2, eğitim sonrası kapalı ve açık kaynak arasında farkı kapatıyor

Günlük ve haftalık bültenlerimize katılarak, sektördeki AI haberlerine dair en son güncellemeleri ve özel içerikleri edinebilirsiniz. Daha fazla bilgi için.


Allen Enstitüsü için AI (Ai2), yeni model eğitim ailesi Tülu 3’ün tanıtımıyla kapalı kaynak ve açık kaynak sonrası eğitim arasındaki farkı azaltmaya çalıştığını iddia ediyor. Bu, açık kaynak modellerinin kurumsal alanda başarılı olacağına dair bir argümanı da beraberinde getiriyor.

Tülu 3, açık kaynak modelleri, OpenAI’nin GPT modelleri, Anthropic’in Claude’u ve Google’ın Gemini’si ile eşdeğer hale getiriyor. Araştırmacılara, geliştiricilere ve işletmelere, açık kaynak modellerini veri kaybı yaşamadan özelleştirme imkanı sunarak, bu modellerin kalitesini kapalı kaynaklı modellere yaklaştırıyor.

Açık Kaynak Modeller için Yeni Bir Dönem

Ai2, Tülu 3’ü tüm veri, veri karışımları, tarifler, kod, altyapı ve değerlendirme çerçeveleriyle birlikte sundu. Tülu’nun performansını artırmak için yeni veri setleri ve eğitim yöntemleri oluşturması gerektiğini vurguladı; bununla birlikte, “doğrulanabilir problemler üzerinde pekiştirmeli öğrenme ile doğrudan eğitim” gerçekleştirdiklerini belirtti.

“En iyi modellerimiz, özel yöntemlerden bazı ayrıntıları yenilikçi teknikler ve köklü akademik araştırmalarla entegre eden karmaşık bir eğitim sürecinin sonucudur” diyen Ai2, blog yazısında başarılı olmalarının dikkatli veri kürasyonu, titiz deneyler, yenilikçi metodolojiler ve geliştirilmiş eğitim altyapısına dayandığını ifade etti.

Şirketler İçin Açık Kaynak Seçenekleri

Açık kaynak modeller genellikle kapalı kaynak modellere göre daha az tercih edilse de, daha fazla şirketin açık kaynak büyük dil modellerini (LLM) projelerinde tercih ettiği bildirilmiştir. Ai2, açık kaynak modellerde yapılan ince ayarların, Tülu 3 gibi modellerle birlikte, daha fazla şirket ve araştırmacı tarafından tercih edilmesini sağlayacağını düşünmektedir. Zira açık kaynak modellerinin Claude ya da Gemini kadar iyi performans gösterebileceğinden emin olabiliyorlar.

Firma, Tülu 3 ve Ai2’nin diğer modellerinin tamamen açık kaynak olduğunu vurguladı. Bununla birlikte, Anthropic ve Meta gibi büyük model eğitmenlerinin, açık kaynak olduğunu iddia etmelerine rağmen, “eğitim verileri veya eğitim tariflerinin kullanıcılar için şeffaf olmadığını” belirtti. Open Source Initiative, yakın zamanda açık kaynak AI tanımının ilk versiyonunu yayımladı, ancak bazı kuruluşlar ve model sağlayıcıları, lisanslarında bu tanımı tam olarak takip etmemektedir.

Tülu 3’ün Diğer Özellikleri

Tülu 3, şirketlerin özelleştirme sırasında veri karışımlarını kullanmalarına olanak tanıyor. Ai2, “Tarifler, veri setlerini dengelemenize yardımcı olur; böylece bir modelin kodlama yapmasını, ayrıca talimatları doğru bir şekilde izleyebilmesini ve birden fazla dilde iletişim kurmasını istiyorsanız, sadece belirli veri setlerini seçip tarifteki adımları takip etmeniz yeterlidir” dedi.

Veri setlerini karıştırıp eşleştirmenin, geliştiricilerin daha küçük bir modelden daha büyük bir ağırlıklı modele geçişlerini kolaylaştırdığı belirtilmektedir. Ai2, Tülu 3 ile birlikte sunduğu altyapı kodunun, şirketlerin model boyutları arasında geçiş yaparken bu süreci oluşturmalarına olanak tanıdığını ifade ediyor.

Ai2’nin değerlendirme çerçevesi, geliştiricilerin modelden ne görmek istediklerini belirleme imkanı sunuyor.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri