Günlük ve haftalık bültenlerimize katılarak sektör lideri yapay zeka haberlerini ve özel içerikleri takip edin. Daha Fazla Bilgi Edinin
Galileo, San Francisco merkezli bir girişim, yapay zekanın geleceğinin güvene dayandığına inanıyor. Şirket, AI ajanlarının işlevselliğini değerlendirme konusunda artan zorlukları ele almak için Agentic Evaluations adını verdiği yeni bir ürünü tanıttı.
AI Ajanları: Güvenilirlik Sorunu
AI ajanları, rapor oluşturma veya müşteri verilerini analiz etme gibi çok adımlı görevleri yerine getiren otonom sistemlerdir. Ancak hızla artan benimseme, şirketlerin bu sistemlerin güvenilirliğini nasıl doğrulayacağı sorusunu gündeme getiriyor. Galileo’nun CEO’su Vikram Chatterji, şirketlerinin bu sorunun yanıtını bulduğuna inanıyor.
Performans Değerlendirme Kriterleri
Önde gelen şirketler, Cisco ve Ema gibi firmalar, çoktan Galileo’nun platformunu benimsemiş durumda. Bu şirketler, müşteri destek hizmetlerinden finansal analizlere kadar birçok görevi otomatik hale getirerek önemli verimlilik artışları kaydetmekte.
Chatterji, “Bir satış temsilcisi, müşteriyle iletişim kurmak için bir haftasını harcayacağı işleri AI destekli ajanlarla iki günde veya daha kısa sürede yapabiliyor,” diyerek, işletmeler için sağlanan yatırım getirisinin altını çiziyor.
Gelişmiş Çözüm: Yetenekli AI Değerlendirmeleri
Galileo’nun yeni çerçevesi, araç seçim kalitesini değerlendiriyor, araç çağrılarındaki hataları tespit ediyor ve genel oturum başarısını izliyor. Ayrıca büyük ölçekli yapay zeka uygulamalarında maliyet ve gecikme gibi temel metrikleri de monite ediyor.
Olası sorunları erkenden belirlemek için geliştirilen bu araçlar, yapay zekanın güvenilirliğini artırmayı hedefliyor. Chatterji, “Şu ürünü lanse etmeden önce, gerçekten çalışıp çalışmadığını bilmemiz çok önemli,” diyor.
Aİ Hallerine ve Kurumsal Zorluklara Çözüm
Galileo, güvenli ve üretime hazır çözümlere odaklanarak yapay zeka güvenliğine ilişkin artan endişeleri gidermeyi hedefliyor. Kurumsal yapay zeka dağıtımı yapan teknik liderler, AI ajanlarının beklenildiği gibi çalışmasını sağlamak için kritik alt yapılar oluşturmak üzere Galileo’nun platformuna güvenebilirler.
2025, AI ajanlarının yılı olacak ve Chatterji, “Birçok şirketin bu ajanları düzgün bir şekilde test etmeden piyasaya sürdüğünü görüyoruz ve bu da olumsuz sonuçlar doğuruyor,” diyerek, doğru test etmenin ve değerlendirmelerin önemini vurguluyor.