SON DAKİKA

İş Dünyası

Cohere, küresel dil bariyerini aşmak için yeni AI modellerini başlatıyor.

Cohere, dil modellerindeki dil farkını kapatmak için Aya projesindeki iki yeni açık ağırlık modelini bugün piyasaya sürdü.

Aya Expanse 8B ve 35B, artık Hugging Face‘de mevcut ve 23 dilde performansın ilerlemesini genişletiyor. Cohere, 8B parametreli modelin “araştırmacılara dünya çapında buluşları daha erişilebilir kıldığını” belirtirken, 32B parametreli modelin ise son teknoloji çok dilli yetenekler sunduğunu söyledi.

Aya Projesi Genişliyor

Aya projesi, İngilizce dışındaki daha fazla dilde temel modellere erişimi genişletmeyi amaçlıyor. Cohere for AI, şirketin araştırma kolu, geçen yıl Aya girişimini başlattı. Şubat ayında, 101 dili kapsayan 13 milyar parametreli Aya 101 büyük dil modelini piyasaya sürdü. Cohere for AI ayrıca diğer diller için model eğitimine erişimi genişletmeye yardımcı olmak için Aya veri setini yayınladı.

Aya’nın Başarısı

Cohere, iki Aya Expanse modelinin tutarlı bir şekilde Google, Mistral ve Meta gibi benzer boyuttaki yapay zeka modellerini geride bıraktığını belirtti.

Aya Expanse 32B, Gemma 2 27B, Mistral 8x22B ve hatta çok daha büyük Llama 3.1 70B’den daha iyi sonuçlar verdi. Daha küçük olan 8B modeli ise Gemma 2 9B, Llama 3.1 8B ve Ministral 8B’den daha iyi performans gösterdi.

Farklı Dillerde Modeller

Aya girişimi, İngilizce dışındaki dillerde iyi performans gösteren büyük dil modelleri etrafında araştırma yapmayı amaçlıyor. Çoğu zaman geniş çapta konuşulan diller için modeller diğer dillere daha sonra erişilebilir hale gelse de, farklı dillerle modelleri eğitmek için veri bulmak zor olabilir.

Diğer geliştiriciler, örneğin OpenAI, geçen ay Hugging Face’de Multilingual Massive Multitask Dil Anlama Veri Setini piyasaya sürdü. Veri seti, Arapça, Almanca, Svahili ve Bengalce de dahil olmak üzere 14 dildeki büyük dil modeli performansını daha iyi test etmeye yardımcı olmayı amaçlıyor.

Cohere son birkaç haftadır oldukça yoğun geçirmekte. Bu hafta şirket, RAG (geri getirme artırılmış üretim) sistemlerinde kullanılan kurumsal gömme ürünü Embed 3’e görüntü arama yetenekleri ekledi. Aynı zamanda bu ay Command R 08-2024 modeli için ince ayarları da iyileştirdi.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri