Günlük ve haftalık bültenlerimize katılın, endüstrideki en son gelişmeler ve özel içerikler hakkında güncel kalın. Daha Fazla Bilgi
Son yıllarda generatif yapay zeka kullanımının hızla artmasıyla birlikte, vektör veritabanları keskin teknolojiden vazgeçilmez kurumsal altyapıya dönüşmüştür.
Vektör veritabanlarının önemi arttıkça, işletmeler performans ve maliyet üzerinde daha fazla durmaya başladı. Zilliz, açık kaynaklı Milvus vektör veritabanının arkasındaki şirket, üretim uygulamaları için maliyetleri ve karmaşıklığı önemli ölçüde azaltmayı amaçlayan yeni özellikler duyurdu. Bu durum, tanıtım aşamalarını geçmiş ve tam ölçekli yapay zeka uygulamalarına geçmiş kurumsal kullanıcıların artan taleplerine yanıt veriyor.
Vektör veritabanı benimsemesinin 2022 sonlarından itibaren patlama gösterdiği bir dönemde, bu yeni özelliklerin sunulması oldukça anlamlı. OpenAI’nin ChatGPT ile birlikte yapay zeka uygulamalarına duyulan ilgi artmış durumda. Yeni özellikler, özellikle genişleyen dağıtım boyutları ve veritabanlarının üretim ortamlarında yönetim karmaşıklıklarıyla başa çıkmakta zorlanan işletmelere yönelik olarak tasarlanmış. Son iki yılda, dağıtım ölçekleri milyonlardan milyarlara yükseldi. Zilliz’in en büyük uygulaması artık 100 milyar vektör yönetiyor. Teknoloji, çok çeşitli kullanım alanlarında, çok modlu uygulamalar, öneri sistemleri, otonom sürüş, ilaç keşfi, dolandırıcılık tespit ve siber güvenlik gibi alanlarda kullanılmakta.
Kurumsal AI Vektör Veritabanlarında Rekabet
2024 yılı itibarıyla, vektör veritabanı teknolojisi, kurumsal yapay zeka uygulamaları için vazgeçilmez hale gelmiştir. Neredeyse her veritabanı sağlayıcısının bir vektör uygulaması bulunmaktadır; bunlar arasında Oracle, Microsoft, Google, DataStax ve MongoDB yer almakta.
Ancak Milvus, amacı doğrultusunda geliştirilmiş bir vektör veritabanıdır. Bu kategorideki diğer rakipler arasında Pinecone bulunmaktadır. Ayrıca diğer açık kaynaklı vektör veritabanı teknolojileri olsa da, Milvus’un, Linux Vakfı’nın LF AI & DATA girişiminin bir parçası olma özelliği oldukça dikkat çekicidir.
Linux Vakfı’nın AI & DATA girişimi bünyesinde bulunan Milvus, katılımcı kurumlar ve kuruluşlardan geniş katkılar almasını sağlamıştır. Xie, Milvus açık kaynak projesine kod katkısında bulunan kuruluşlar arasında IBM, Nvidia, Apple, Salesforce ve Intel’in bulunduğunu belirtmiştir.
Zilliz’in Vektör Veritabanını Geliştirme Çabaları
Zilliz Cloud teklifi, açık kaynaklı Milvus veritabanı üzerine inşa edilmiştir. Bu hizmet, veritabanını kullanmayı ve tüketmeyi kolaylaştıran yönetilen bir hizmet sunmaktadır.
Son Zilliz Cloud güncellemesi ile birlikte, kullanıcıların manuel parametre ayarlamasına gerek kalmadan otomatik bir indeksleme sistemi eklenmiştir. Bu yeni özellik, en iyi performansı sağlamak için en uygun indeksleme algoritmalarını otomatik olarak seçmektedir.
Xie, “Kutu içinden en iyi performansı alırsınız” diyerek yeni özelliğin avantajlarını vurgulamıştır.
Özelleştirilmiş Algoritma İyileştirmeleri
Bir adım daha ileri giderek, Zilliz, bir algoritma optimizasyonu entegre etmeye başlamıştır. Bu optimizasyon, hem IVF (inverted file) hem de grafik tabanlı vektör alma algoritmaları ile çalışabilmektedir. Hafıza tahsisi ve hesaplama performansı hızlı çalışmayı sağlamak üzere optimize edilmiştir ve bu, optimize edilmemiş uygulamalara göre %300 hız artışı sağlayabilir.
Bu algoritma optimizatörü, belgeler arama sistemleri, öneri motorları, dolandırıcılık tespiti veya diğer vektör tabanlı uygulamalarda kullanılmaktadir.
Hibrit Arama ve Depolama Yenilikleri ile Maliyetlerin Düşürülmesi
Yeni sürüm aynı zamanda, geleneksel anahtar kelime tabanlı aramalarla vektör benzerlik aramasını birleştiren hibrit arama işlevselliği sunmaktadır.
Bu entegrasyon, şirketlerin arama alt yapısını birleştirmelerine ve operasyonel karmaşıklığı azaltmalarına olanak tanır. Xie, anahtar kelime tabanlı arama bileşeninin endüstri standardı BM25 algoritması ile birlikte çalıştığını açıklamıştır.
Artan depolama maliyetlerine yanıt olarak, Zilliz, bu hizmeti geleneksel bellek içi vektör veritabanlarından daha maliyet etkin hale getiren hiyerarşik bir depolama sistemi uygulamıştır. Çok katmanlı depolama hiyerarşisi, verilerin çoğunun yerel diskler ve nesne depolama üzerinde saklanmasına olanak tanır.
Xie, bu yeni yenilikler sayesinde Zilliz’in kullanıcılar için vektör veritabanı tüketim maliyetlerini düşürebileceğini ileri sürmektedir.
Gelecekte, Zilliz’in daha fazla maliyet optimizasyonu hedefleyen iddialı planları bulunmaktadır. Xie, “Önümüzdeki beş yıl içinde, vektör veritabanı çözümlerinin toplam maliyetinin on kat azalacağını çok iddialı bir şekilde tahmin ediyorum.” ifadelerini kullanmıştır.