Günlük ve haftalık bültenlerimize katılın, sektördeki AI gelişmeleri hakkında en son güncellemeleri ve özel içerikleri alın. Daha Fazla Bilgi
Salesforce, yapay zekanın iş uygulamalarındaki en büyük zorluklarından birini ele alıyor: AI sistemlerinin ham zekası ile öngörülemeyen kurumsal ortamlarda tutarlı bir şekilde performans gösterme yeteneği arasındaki fark. Bu duruma şirket, “jagged intelligence” adını veriyor.
Bugün yapılan kapsamlı bir araştırma duyurusunda, Salesforce AI Araştırması, gelecekteki AI ajanlarını daha akıllı, güvenilir ve çok yönlü hale getirmek için tasarlanan bir dizi yeni kıstas, model ve çerçeve tanıttı. Bu yenilikler, AI sistemlerinin yeteneklerini ve tutarlılığını artırmayı hedefliyor, özellikle karmaşık iş ortamlarında otonom ajanlar olarak uygulanırken.
Salesforce’un AI Tutarsızlık Problemini Nasıl Ölçtüğü ve Giderdiği
Araştırmanın merkezinde, AI’nin performansındaki tutarsızlıkları ölçmek ve ele almak yer alıyor. Salesforce, AI sistemlerinin gerçekten ne kadar “jagged” olduğunu ölçmek için 225 basit akıl yürütme sorusunu içeren SIMPLE veri setini tanıttı.
Bir işletme için bu tutarsızlık sadece akademik bir mesele değil. Bir AI ajanının tek bir hatası, operasyonları kesintiye uğratabilir, müşteri güvenini zedeler ya da önemli finansal kayıplara yol açabilir.
CRMArena: Salesforce’un Kurumsal AI Ajanları için Sanal Test Alanı
Bu araştırmadaki belki de en önemli yenilik, CRMArena adlı yenilikçi bir kıyaslama çerçevesidir. Bu çerçeve, gerçek müşteri ilişkileri yönetimi senaryolarını simüle ederek, AI ajanlarının profesyonel bağlamlarda kapsamlı şekilde test edilmesine olanak tanır. Bu sayede akademik kıyaslamalar ile gerçek iş gereklilikleri arasındaki açığı kapatıyor.
“Mevcut AI modellerinin genelde kurumsal çevrelerin karmaşık gereksinimlerini yansıtmada yetersiz kaldığını fark ettik, bu yüzden CRMArena’yı geliştirerek gerçekçi, profesyonel CRM senaryolarını simüle ettik,” diye açıkladı Savarese.
Yeni Gömme Modelleri ile Kurumsal Bağlamda Daha İyi Anlayış
Tanıtılan teknik yeniliklerden biri, derin anlamlandırma için tasarlanmış SFR-Embedding adlı yeni bir modeldir. Bu model, 56 veri setinde Massive Text Embedding Benchmark’ı (MTEB) geçerek liderlik yapıyor.
“SFR-embedding sadece bir araştırma değil. Çok yakında Data Cloud’da yer alacak,” dedi Heinecke.
Bu tanıtılan modeller, Salesforce’un güvenlik, tutarlılık ve performans gibi kritik alanlarda geliştirilmesine yardımcı olacak yeni imkanlar sunmaktadır.
Salesforce’un AI stratejisi, iş ortamlarındaki karmaşıklıkları ve güvenlik endişelerini dikkate alarak, ilerici ve uygun çözümler sunma hedefini gütmektedir. Şirketin bu alandaki yenilikleri, pazar rekabetindeki yerini güçlendirme yolunda önemli bir adım olarak görülüyor.