Günlük ve haftalık bültenlerimize katılarak sektördeki en son güncellemeleri ve özel içerikleri takip edin. Daha Fazla Bilgi
Kurumsal yapay zeka, bir modelin erişiminde olan verilerin kalitesi kadar değerlidir.
Geçmişte, firmalar genellikle yapılandırılmış verilere dayanıyordu. Ancak generatif yapay zekanın hızlı bir şekilde benimsenmesi ile birlikte, işletmeler giderek daha büyük miktarda yapılandırılmamış verilere yöneliyor. Yapılandırılmamış veri, tanım gereği yapıya sahip değildir ve birçok formatta bulunabilir. Bu, işletmeler için zorlu bir durum yaratabilir çünkü yapılandırılmamış verilerin kalitesi genellikle belirsizdir. Veri kalitesi, doğruluk, bilgi boşlukları, tekrarlama gibi verilerin faydasını etkileyen diğer sorunları içerebilir.
Uzun zamandır yapılandırılmış veriler için kullanılan veri kalitesi araçları, şimdi kurumsal yapay zeka için yapılandırılmamış veriler üzerine de genişlemektedir. Bu alanda çalışan bir firma olan Anomalo, birkaç yıldır yapılandırılmış veri kalite platformunu geliştirmektedir. Bugün, firma, yapılandırılmamış veri kalitesi izleme konusunda platformunu daha da geliştirdiğini duyurdu.
Anomalo’nun kurucu ortağı ve CEO’su Elliot Shmukler, şirketin teknolojisinin organizasyonlar üzerinde önemli bir etki yaratabileceğine inanıyor.
Shmukler, “Veri kalitesi sorunlarını ortadan kaldırarak, generatif yapay zeka projelerinin en az %30’unu hızlandırabileceğimize inanıyoruz” dedi.
Veri Kalitesinin Önemi
Geleneksel yapılandırılmış veri kalitesi sorunlarından farklı olarak, yapılandırılmamış içerik, yapay zeka uygulamaları için benzersiz zorluklar sunuyor.
“Çünkü bu yapılandırılmamış veri, içinde her şey olabilir,” diyen Shmukler, “kişisel olarak tanımlanabilir bilgiler, insanların e-postaları, isimleri, sosyal güvenlik numaraları… bu belgelerde belki de istemediğiniz gizli bilgiler olabilir” ifadelerini kullandı.
Anomalo platformu, bu zorlukları aşmak için yapılandırılmış metadata ekleyerek, kuruluşların verilerini AI modellerine ulaşmadan önce daha iyi anlamasını ve kontrol etmesini sağlıyor.
Anomalo’nun Yenilikçi Özellikleri
Anomalo yazılımı, yapılandırılmamış veri kalitesi için aşağıdaki önemli özellikleri sunuyor:
Özel sorun tanımı: Kullanıcıların, belgeler içindeki öngörülen sorunların ötesinde kendi sorunlarını tanımlamalarını sağlar.
Özel bulut modelleri desteği: İşletmelerin kendi bulut ortamlarında konuşlandırılmış büyük dil modellerini (LLM’ler) kullanmalarını sağlar, böylece verileri üzerinde daha fazla kontrol ve güvenlik sunar.
Metadata etiketleme: Yüksek kaliteli veri curationu ve filtreleme olanağı sunmak için, tespit edilen sorunlar hakkında bilgiler ekler.
Redaksiyon: Çok yakında sunulacak bir özellik, yazılımın belgelerin hassas bilgilerini kaldırarak redakte edilmiş versiyonlarını sağlamasına olanak tanıyacak.
Pazar Farklılaşması ve Yenilikçi Yaklaşımlar
Anomalo, yapılandırılmamış veri kalitesi pazarında yalnız değil; bu alandaki diğer firmalar arasında Monte Carlo Data, Collibra ve Qlik de bulunmaktadır. Shmukler, şirketinin farklılaştığı birkaç alanı vurguladı.
Shmukler, diğer satıcıların yapılandırılmamış veri kalitesine yönelik yaklaşımlarının, veri akışının oluşturulduğu ve bunun üzerine takip edilen vektör veritabanları ile entegre edilmesi gerektiğini belirtti. “Anomalo olarak, biz ham yapılandırılmamış veri koleksiyonlarını analiz ediyoruz, böylece daha geniş bir veri keşfine olanak tanıyoruz,” dedi.
Shmukler, veri kalitesi izleme sisteminin firmaların gen AI uygulamalarını inşa ederken hassas verileri açığa çıkarmasını önleyerek riskleri azaltma konusunda etkili olacağını belirtti.
“Her işletme, LLM’lerin verilerin yanıtlarını verip vermediğinden endişe duyuyor ve bunun nasıl yanlış olabileceğine dair kaygılar taşıyor,” dedi. “Bu konuda doğru önlemler almak, daha güvende hissetmemizi sağlıyor.”