Günlük ve haftalık bültenlerimize abone olun, endüstri lideri AI kapsama alanındaki en son güncellemeleri ve özel içerikleri takip edin. Daha Fazla Bilgi Edinin
Pinecone, son yıllarda dikkat çeken bir yerel vektör veritabanı platformu olarak kendini kanıtladı. Pinecone, giderek rekabetçi hale gelen pazarda, kurumsal AI sorunlarını çözmeye yardımcı olacak yeni yetenekler sunarak farklılaşmaya devam ediyor.
Bugün Pinecone, adını taşıyan vektör veritabanı platformuna yönelik bir dizi güncelleme duyurdu. Bu güncellemeler arasında, yoğun ve seyrek vektör alımının faydalarını birleştiren yeni bir kademeli alım yaklaşımı bulunuyor. Pinecone ayrıca, vektör gömme işlemleri için doğruluğu ve verimliliği artırmaya yardımcı olacak yeni bir yeniden sıralama teknolojisi setini devreye alıyor. Şirket, bu yeni yeniliklerin kurumsal AI uygulamalarını %48’e kadar daha doğru bir şekilde oluşturmasına yardımcı olacağını öne sürüyor.
Yoğun ve Seyrek Vektörler Arasındaki Farkı Anlamak
Bugüne kadar Pinecone, birçok diğer vektör veritabanı teknolojisi gibi yoğun vektörler kullanıyordu.
Jones, yoğun metin gömme modellerinin, anlamı ve bağlamsal anlamı yakalayan sabit uzunlukta vektörler ürettiğini açıkladı. Bu vektörler bağlamı korumada gücünü korurken, anahtar kelime araması veya varlık sorgulama konusunda o kadar etkili olmayabilir. Özellikle telefon numaraları, parça numaraları gibi özel varlıklarla ilgilendiğinde, yoğun modeller önemli ince ayarlar olmadan bazı zorluklar yaşayabiliyor.
Buna karşılık, seyrek indeksler, daha esnek bir anahtar kelime araması ve varlık sorgulamasına olanak tanır. Pinecone, yalnızca yoğun vektör aramasının sınırlamalarını aşmak için seyrek indeksler ekliyor. Genel hedef, daha kapsamlı bir alım çözümü sağlamaktır.
Kademeli Alımın Faydaları
Anahtar kelime türündeki aramaların vektörlerle birleştirilmesi yeni bir kavram değil. Bu, sıklıkla yalnızca hibrit arama terimi altında toplanan bir tasarım. Jones, yeni Pinecone yaklaşımını kademeli alım olarak adlandırıyor ve bunun basit bir hibrit aramadan farklı olduğunu belirtiyor.
Jones, kademeli alımın sadece yoğun ve seyrek indekslerin paralel çalıştırılmasından daha öteye geçtiğini vurguladı. Bu yaklaşım, yoğun ve seyrek alımın üzerine yeniden sıralama modelleri gibi bir dizi geliştirme eklemeyi içeriyor. Kademeli yaklaşım, temel olarak farklı tekniklerin güçlerini birleştiriyor, basit bir puan bazlı sonuç birleştirmesi yapmaktan öteye geçiyor.
Yeniden Sıralama ile Doğruluk Artışı Sağlama
Pinecone, sonuçların doğruluğunu artırmak için yeni yeniden sıralama teknolojileri ile güncellemeler yapıyor.
Bir AI yeniden sıralayıcı, bir sorgudan dönen sonuçların sırasını optimize etmek için kritik bir araçtır. Pinecone’un güncellemeleri, Cohere’ın son teknoloji Rerank 3.5 modelini ve Pinecone’un kendi yüksek performanslı yeniden sıralayıcılarını içerecek şekilde bir dizi yeniden sıralama seçeneği sunuyor.
Pinecone, kendi yeniden sıralayıcı teknolojisini geliştirerek, kalabalık vektör veritabanı pazarında daha da farklılaşmayı hedefliyor. Yeni Pinecone yeniden sıralayıcıları, şirket tarafından geliştirilen ilk yeniden sıralayıcılar olup, mümkün olan en iyi sonuçları sunmayı amaçlıyor. Pinecone’un kendi analizine göre, yeni pinecone-rerank-v0, Benchmarking-IR (BEIR) ölçeği ile yapılan karşılaştırmalarda arama doğruluğunu %60 oranında artırabiliyor. Ayrıca, yeni pinecone-sparse-english-v0 yeniden sıralama modeli anahtar kelime bazlı sorgular için %44 oranında bir performans artışı sağlamaya potansiyel olarak yardımcı olabilir.
Bu yeniden sıralama bileşenlerinin başlıca avantajı, Pinecone’un yoğun ve seyrek indekslerin çıktısını birleştirerek optimize edilmiş alım sonuçları sunmasını sağlamasıdır. Bu durum, firmalar için önemlidir çünkü alım yığınlarını birleştirerek daha iyi performans elde etmelerini sağlar. Pinecone, kullanıcıların sadece metin göndermesi ve yeniden sıralanmış sonuçlar alabilmesi için sıkı bir entegrasyon sağlamayı hedefliyor.
Platformda daha fazla özellik bulundurmanın yanı sıra, Jones, maliyetleri optimize etmeye yardımcı olan sunucusuz bir teklif sunduklarını vurguladı. Platformun sunucusuz mimarisi, gerçek kullanım eğilimlerine dayanarak otomatik olarak ölçeklenir.
“Sunucusuz bir ödeme modeli sürdürüyoruz,” diyor Jones. “Uygulamalara yönelik trafik, belirli bir günde çok farklı görünebiliyor; ister sorgular olsun, ister belgelere indekslenmesi gereken yazılar… bunların hepsini yönetiyoruz, dolayısıyla herhangi bir zamanda fazla kaynak tahsis edilmesine gerek kalmıyor.”