Onehouse, Hudi’nin yaratıcısı, 30 kat daha hızlı veri gölü sorguları sunan bir runtime tanıttı

Günlük ve haftalık bültenlerimize katılın; endüstriyi yönlendiren yapay zeka haberleri ve özel içerikler için en son güncellemeleri alın. Daha Fazla Bilgi


Kuruluşlar, veri gölü evlerinde (data lakehouse) artan miktarda bilgi depoladıkça, sorguların yavaşlaması ve maliyetlerin artması gibi sorunlarla karşılaşabiliyor.

Onehouse bu sorunu çözmek üzere harekete geçti. Açık kaynaklı Apache Hudi ve Apache XTable veri gölü tablo formatlarının önde gelen katkıcılarından biri olan bu teknoloji tedarikçisi, Onehouse Compute Runtime (OCR) adlı yeni bir ürünüyle, sorgu süresini %30 oranında hızlandırma vaadi sunuyor. Bu hız, Onehouse’ın iddialarına göre maliyetleri %80 oranında düşürebilir.

Açık Veri Gölü Tablolarının Hızlandırılması İhtiyacı

Piyasada Apache Hudi, Apache Iceberg ve Delta Lake gibi pek çok açık veri gölü tablo formatı bulunuyor. Onehouse, bu formatlar arasında bir düzeyde birlikte çalışabilirlik sağlayan Apache XTable projesine de öncülük ediyor. Yeni hesaplama motoruyla, işletmelerin herhangi bir açık veri gölü tablo formatını daha kolay bir şekilde sorgulamasını hedefliyor. Amazon Redshift, Databricks, Google BigQuery ve Snowflake gibi popüler hizmetler de bu kapsama dahil.

Yeni teklif, mevcut hesaplama motorlarındaki boşlukları gidermeyi ve açık tablo formatlarında veri yoğun uygulamaları çalıştırmak için daha verimli bir yol sunmayı amaçlıyor. Onehouse CEO’su Vinoth Chandar, “Göl evlerine özgü çalışma yüklerine optimize edilmiş özel bir çalışma zamanı geliştirmemiz gerektiğini düşünüyoruz.” diyerek, sektördeki mevcut boşluğa dikkat çekiyor.

Onehouse Compute Runtime Nasıl Çalışır?

Onehouse Compute Runtime, açık hesaplama motorları (Apache Spark gibi) ve açık tablo formatları ile entegre olan bir katman olarak çalışıyor. Üç ana bileşenden oluşuyor:

  • Uyarlanabilir çalışma yükü optimizasyonları
  • Yüksek performanslı göl evi girdi/çıktısı (I/O)
  • Bir kuruluşun sanal özel bulutundaki sunucusuz hesaplama yönetimi

Uyarlanabilir çalışma yükü optimizasyonları, belirli iş yüklerinin (veri alımı veya sorgu işleme gibi) yürütülmesini, gözlemlenen desenlere dayanarak zekice ayarlayabilmesini sağlıyor. Bu sistem, tipik olarak manuel ayar gerektiren dosya boyutları ve veri organizasyonu desenlerini otomatik olarak optimize edebiliyor.

Daha Hızlı Sorguların İşletmelere Etkisi

Onehouse Compute Runtime’ın erken kullanıcılarından biri olan dijital optimizasyon tedarikçisi Conductor, yeni çalışma zamanının kendilerine birçok avantaj sağladığını belirtiyor. Conductor’un principal yazılım mühendisi Emil Emilov, “Onehouse, şirketimizin merkez veri deposunu sağlıyor ve bu veri, tüm veri analitik ihtiyaçlarımızı besliyor. Yeni runtime, taze veri sunmamıza yardımcı olarak daha güncel içgörüler edinmemizi sağlıyor.” diyor.

Onehouse Compute Runtime, sorgu performansını hızlandırarak bu içgörülere daha hızlı erişim sağlıyor. Bu da daha iyi hizmet sunmak ve yüksek müşteri memnuniyeti demek.

Maliyet Tasarrufu ve Yeni Yetenekler

Onehouse Compute Runtime tarafından sunulan performans iyileştirmeleri, veri gölü evlerinde çalışan kuruluşlar için önemli maliyet tasarrufu sağlayabilir. Veri organizasyonunu optimize ederek ve taranması gereken veri miktarını azaltarak, toplam hesaplama maliyetlerini düşürmeye yardımcı olabilir.

Chandar, “Maliyet ve performans, göl evinde iki taraflı bir madalyon gibidir, zira yaptığımız iş, bir dizi işi çalıştırıp çok fazla veri taramaktan ibarettir.” diyerek bu durumun altını çiziyor. “Bu nedenle buradaki her şey verimliliği artırmak üzerine, bu da performans kazançları sağlarken maliyetleri düşürmek anlamına geliyor.”

Exit mobile version