SON DAKİKA

İş Dünyası

Veri darboğazını aşmak: Salesforce’un ProVision ile çok modlu AI eğitimi

Günlük ve haftalık bültenlerimize katılın, sektör lideri AI haberleri hakkında en son güncellemeleri ve özel içerikleri alın. Daha Fazla Bilgi


Dünyada birçok şirket, AI projelerine yatırım yapmaya devam ettikçe, yüksek kaliteli eğitim verisi bulmak önemli bir engel haline gelmiştir. Herkesin erişebileceği kamu webi veritabanları tükenmeye yüz tutarken, OpenAI ve Google gibi büyük oyuncular, sahip oldukları veri setlerini genişletmek için özel ortaklıklar yapıyor, bu da diğerlerinin erişimini daha da kısıtlıyor.

Sentetik Veri Üretimi ile Çözüm

Salesforce, görsel eğitim verileri alanında büyük bir adım atarak ProVision adlı yeni bir çerçeve geliştirdi. Bu çerçeve, görsel talimat verilerini programatik olarak üretiyor. Bu şekilde oluşturulan veri setleri, yüksek performanslı çok modelli dil modellerinin (MLM’ler) eğitilmesine yardımcı oluyor ve bu modellerin görsellere dair soruları doğru yanıtlamasını sağlıyor.

ProVision-10M Veri Seti

Salesforce, bu yaklaşımı kullanarak ProVision-10M veri setini yayınladı ve bu veri setini, çeşitli çok modelli AI modellerinin performansını ve doğruluğunu artırmak için kullanıyor. Her veri profesyoneli için bu çerçeve, nitelikli görsel talimat verisi üretimindeki bağımlılığı azaltarak büyük bir ilerleme sağlıyor.

Görsel Talimat Verisinin Önemi

Görsel talimat veri setleri, AI’nin ön eğitim veya ince ayar süreçlerinde temel bir rol oynuyor. Bu özel veri setleri, modellerin belirli talimatları izleyip bunlara etkin bir şekilde yanıt vermesine yardımcı oluyor. Ancak, bu tür veri setlerini üretmek oldukça zahmetli bir süreçtir. Eğer bir şirket her başlık için verileri manuel olarak oluşturursa, oldukça fazla zaman ve insan kaynağı kaybı yaşayabilir.

Salesforce’un ProVision çerçevesi, bu zorlukları aşmak için sahne grafiği adı verilen yapıları kullanıyor. Bu grafikler, her bir nesneyi bir düğüm olarak temsil eder ve her nesnenin özellikleri, ilgili düğümlere doğrudan atanır. Ayrıca, bu yapılar elde edilen özelliklerle birlikte daha çeşitli talimat verileri üretebilmek için programlar çalıştırıyor.

ProVision-10M’nin Etkileri

ProVision-10M, 10 milyondan fazla benzersiz talimat veri noktası ile önemli bir kaynak olarak karşımıza çıkıyor. Bu veri setinin, çok modelli AI ince ayar süreçlerine dahil edilmesi ile belirgin performans iyileştirmeleri elde edildi. Araştırmacılar, bu veri altyapısı ile birlikte, yaklaşık %7 ile %8 arası iyileştirmeler kaydetti.

Sonuçta, ProVision çerçevesi, manuel etiketlemenin üzerinde bir zemin sunarak daha hızlı ve verimli bir eğitim süreci sağlıyor. Sentetik veri üretimi, AI eğitiminde gelecekte önemli bir yer kaplayacak gibi görünüyor.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri