OpenAI’nin ajan aracı çıkışa yakın!

OpenAI, PC’nizi kontrol edebilen ve sizin adınıza işlemleri gerçekleştirebilen bir yapay zeka aracı olan Operator‘ü piyasaya sürmeye yaklaşmış gibi görünüyor.

Operator Aracının Yükselişi

Yazılım mühendisi Tibor Blaho, yaklaşan yapay zeka ürünlerini sızdırma konusunda tanınmış bir isim olup, OpenAI’nin uzun zamandır beklenen Operator aracına dair kanıtlar bulduğunu iddia etti. Daha önce Bloomberg gibi yayımlar, Operator’un otonom olarak kod yazma ve seyahat ayarlama gibi görevleri gerçekleştirme yeteneğine sahip bir “ajans” sistemi olduğunu bildirmişti.

Çıkış Tarihi ve Erken Bilgiler

The Information’a göre, OpenAI, Operator‘ü Ocak ayında piyasaya sürmeyi planlıyor. Blaho’nun bu hafta sonunda bulduğu kod parçaları, bu raporları güçlendirmekte.

OpenAI’nin macOS için geliştirdiği ChatGPT istemcisine, şu an için gizli olan “Toggle Operator” ve “Force Quit Operator” kısayollarını tanımlama seçenekleri eklendi. Blaho’ya göre, OpenAI’nin web sitesinde de Operator ile ilgili henüz kamuya açık olmayan referanslar mevcut.

Gizli Performans Verileri

Blaho’ya göre, OpenAI’nin web sitesinde diğer bilgisayar kullanan yapay zeka sistemleriyle Operator‘ün performansını karşılaştıran tablolar yer alıyor. Bu tablolar muhtemelen yer tutuculardır. Ancak eğer sayılar doğruysa, Operator‘ün belirli görevlerde %100 güvenilir olmadığı görülmektedir.

OSWorld gibi bir benchmarkta, “OpenAI Computer Use Agent (CUA)” olarak adlandırılan ve muhtemelen Operator’u güçlendiren yapay zeka modeli %38.1 oranında bir başarı elde etti. Bu, Anthropic’in bilgisayar kontrol modeli üzerindedir ancak insanlar tarafından elde edilen %72.4’lük başarının çok gerisindedir. OpenAI CUA, web sitelerinde gezinme ve etkileşimde bulunma yeteneğini değerlendiren WebVoyager testinde insan performansını aşmaktadır. Ancak, başka bir web tabanlı benchmark olan WebArena’da insan düzeyindeki puanların gerisindedir.

Operator, bir insanın kolaylıkla başarabileceği görevlerde de zorluklar yaşamaktadır. Sızdırılan bilgilere göre, bir bulut sağlayıcısına kaydolmak ve sanal bir makine başlatmak gibi bir testte yalnızca %60 başarı gösterebilirken, bir Bitcoin cüzdanı oluşturma görevinde ise başarısı %10’a düşmektedir.

Güvenlik Testleri ve Endişeler

OpenAI’nin yapay zeka ajanları pazarına girmesi, Anthropic, Google gibi rakiplerin bu alandaki atılımlarıyla eş zamanlı gerçekleşiyor. Yapay zeka ajanları, riskli ve spekülatif projeler olarak görülse de teknoloji devleri bunları yapay zekanın bir sonraki büyük işi olarak nitelendiriyor. Markets and Markets adlı analiz firması, yapay zeka ajanları pazarının 2030 yılına kadar 47.1 milyar dolar değerine ulaşabileceğini öngörüyor.

Güvenlik testleri, Operator‘ün uzun geliştirme sürecinin nedenlerinden biri olarak belirtiliyor. Bir sızdırılan grafikte, Operator‘ın “yasa dışı faaliyetler” gerçekleştirmeye çalışması ve “hassas kişisel verileri” araması gibi belirli güvenlik değerlendirmelerinde iyi performans gösterdiği görülüyor. OpenAI ortak kurucusu Wojciech Zaremba, yakın zamanda yaptığı bir paylaşımda, güvenlik önlemleri eksik olduğu gerekçesiyle Anthropic’ı eleştirdi. “OpenAI benzer bir ürün çıkarsaydı, olası olumsuz tepkiler hakkında hayal edebiliyorum,” diye yazdı.

OpenAI’nin güvenliği yeterince önemsemediği, eski çalışanların ve araştırmacıların eleştirilerine de maruz kalıyor.

Exit mobile version