SON DAKİKA

İş Dünyası

Cohere, RAG arama yeteneklerine vizyon ekliyor.

Cohere, Arama Modeline Görselleri Eklemek İçin Çok Modlu Gömme Özelliklerini Ekledi

Cohere, çok modlu gömme özelliklerini arama modeline ekledi ve kullanıcıların görselleri RAG tarzı kurumsal aramaya entegre etmelerini sağladı.

Geçen yıl ortaya çıkan Embed 3, verileri sayısal temsillemelere dönüştüren gömme modellerini kullanıyor. Gömlemeler, çağrılan bilgiyi elde etmek için modelin kontrol edebileceği belge gömlemeleri yapılabilen geriye dönük üretime (RAG) önemli hale gelmiştir.

Yeni çok modlu versiyon, hem görsellerde hem de metinlerde gömlemeler oluşturabiliyor. Cohere, Embed 3’ün şu anda pazardaki en genel olarak yetenekli çok modlu gömme modeli olduğunu iddia ediyor. Cohere’in kurucu ortağı ve CEO’su Aidan Gomez, Embed 3 ile görüntü arama performansındaki gelişmeleri gösteren bir grafik yayınladı.

“Bu gelişme, işletmelerin görüntülerde depolanan büyük miktarda verilerinden gerçek değer çıkarmalarını sağlar,” Cohere, bir blog yazısında belirtti. “Şirketler şimdi karmaşık raporlar, ürün katalogları ve tasarım dosyaları gibi önemli çok modlu varlıkları hızlı ve doğru bir şekilde arayarak çalışan verimliliğini artırabilirler.”

Performans İyileştirmeleri

Cohere, Embed 3’teki kodlayıcıların “birleşik gizli alan”ı paylaştığını belirterek kullanıcıların veritabanında hem görüntüleri hem de metinleri dahil edebilmelerini sağladığını söyledi. Şirket, başka modellere göre daha iyi karışık modluk aramalar yapılmasını sağladığını belirtti.

Şirkete göre, “Diğer modeller genellikle metin ve görüntü verilerini ayrı alanlara kümelendirir ve bu da metin tabanlı verilere yönelik etkisiz, metin verilerine önyargılı arama sonuçlarına yol açar. Öte yandan Embed 3, verinin arkasındaki anlamı önceliklendirirken belirli bir modaliteye önyargı göstermeden veriye bakar.”

Yetenekler Eşitleme

Birçok tüketici, Google gibi platformlarda ve ChatGPT gibi sohbet arayüzlerinde görüntü tabanlı arama seçeneklerinin sunulmasıyla çok modlu aramayı hızla benimsemeye başladı. Bireysel kullanıcılar resimlerden bilgi arama alışkanlığı kazandıkça, aynı deneyimi iş hayatlarında da istemeleri mantıklıdır. Diğer gömme modelleri sunan şirketlerin yanı sıra, bazı model geliştiricileri, Google ve OpenAI gibi, belirli bir tür çok modlu gömme seçenekleri sunar. Diğer açık kaynak modelleri de resimler ve diğer modlar için gömbeleme yapmayı mümkün kılabilmektedir.

Kohere, dönüştürücü modelden sorumlu araştırmacılardan bazıları tarafından kurulan (Gomez ünlü “Dikkat Her şeydir” makalesinin yazarlarından biridir), kurumsal alandaki birçok kişi için akılda kalmakta zorlanmıştır. API’lerini daha önce rakip modellere kolayca geçiş yapmalarını sağlamak için güncelleyen Cohere, bu hamlenin genellikle müşterilerin modeller arasında geçiş yaptığı endüstri standartlarıyla uyum sağlamak amacıyla yapıldığını belirtmişti.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri