Canlı medya akışları, üretim kapasitelerini artırmak için giderek daha fazla yapay zeka mikroservisleri kullanmaktadır. Ancak, gelişmiş yapay zeka modellerinin çoğu bulutta barındırıldığı için, yüksek bit hızında ve sıkıştırılmamış medya akışlarını işlemek, ağ gecikmesi, bant genişliği ve gerçek zamanlı ölçeklenebilirlik gibi kısıtlamalar nedeniyle zorlu hale gelmektedir.
NVIDIA, yapay zeka geliştirmeyi kolaylaştıran yeni AI referans uygulamaları yayımladı. Bu teknolojiler, sıkıştırılmamış ST 2110 akışlarıyla etkileşime girerek, minimal gecikmeyle gerçek zamanlı medya efektleri oluşturmaya olanak tanır.
Yapay Zeka Referans Uygulamaları
Holoscan for Media’da bulunan en son yapay zeka referans uygulamaları, canlı medya akışlarını hedefleyen gerçek zamanlı yapay zeka çözümleri geliştirmek için güçlü bir başlangıç noktası sunmaktadır.
Yapay Zeka Sanal Kameralar
PyTorch ve NVIDIA DeepStream SDK kullanarak oluşturulan basit bir uygulama, bir video içindeki her sunucu için sanal kameralar oluşturur. Yüksek çözünürlüklü, sıkıştırılmamış bir ST 2110 girdi akışında bulunan bireyleri tespit edip takip ettikten sonra, bu referans uygulama, tespit edilen bireylere odaklanan birden fazla kesilmiş sanal kamera çıktısı üretir. Yapay zeka ile üretilen kamera akışları sayesinde, operatörler tek bir statik kamerayla daha dinamik bir prodüksiyon çekimi yaratabilir.

Otomatik Konuşma Tanıma
Bu referans uygulama, eğitimli gerçek zamanlı otomatik konuşma tanıma (ASR) uygulamaları aracılığıyla ST 2110-30 ses kaynağında çalışmaktadır. Kullanıcıların gerçek zamanlı olarak transkripti izlemelerini sağlayan basit bir web arayüzü sunar ve kelimeler arasında arama yapmalarına imkan tanır. Kullanıcılar, akıştaki canlı altyazıları görecek ve transkript üzerinde arama yapabileceklerdir. Basit ön yüz, geliştiricilerin uygulamayı daha da geliştirmeleri ve özelleştirmeleri için bir başlangıç noktası sağlar.
Nasıl Başlayabilirsiniz
Yapay zeka referans uygulamaları ile çalışmaya başlamadan önce, geliştirme sürecinizi kolaylaştırmak ve yaygın kurulum sorunlarını önlemek için aşağıdaki ön koşulları yerine getirdiğinizden emin olun:
- NVIDIA RTX Pro GPU’ya sahip bir AI iş istasyonu ve NVIDIA ConnectX ağ arayüz kartına (döngü geri veya anahtar bağlantısı ile) veya belgeli çoklu GPU sistemine ihtiyacınız var.
- Bir NVIDIA Holoscan for Media ortamının işlevsel olması, ya Kubernetes ile yerel geliştirici kurulumu ya da atlama düğümü ile platform referans dağıtım kılavuzunu kullanmalısınız.
- Linux platformları için Visual Studio Code veya diğer bir IDE’ye ihtiyacınız var. GNU Compiler Collection (GCC) de kullanılabilir.
v25.4’ü kurmak için, Holoscan for Media koleksiyon sayfasındaki geliştirici kılavuzlarına başvurun.
Yapay zeka uygulaması kurulumunu gerçekleştirmek için, AI Referans Uygulamaları kaynakları sayfasındaki adımları takip edin.
Ek Güncellemeler
Ayrıca, Holoscan for Media 25.4 sürümü, üretim (OpenShift) ve yerel geliştirici (bulut yerel yapı) ortamları için geliştirilmiş izleme özellikleriyle birlikte gelmektedir. Bu sürüm, SR-IOV ağı, PTP ve NMOS kayıt uygulaması için özel Grafana panoları kullanmaktadır.
Tek düğümlü OpenShift kurulumu ve üç düğümlü kompakt kümeler için otomasyon da geliştirilmiştir. Bu, daha fazla ağ varyantını destekler ve ST 2022-7 yedekliliği için kırmızı/mavi ağ oluşturmaya olanak tanır. Ayrıca, yerel geliştirici kurulumu için otomasyonu basitleştirir (artık Ubuntu 24.04 sürümünü destekler) ve Helm kontrol paneli, NMOS kayıtlı uygulaması, NMOS denetleyici veya medya geçidi gibi referans uygulamalarının otomatik kurulumunu sağlar.
Sonuç
Holoscan for Media, çoklu satıcı canlı üretim için konteyner orkestrasyonu sağladı ve bir yıldan fazla süredir bu alanda hizmet vermektedir. En son 25.4 sürümü, geliştiriciler için ilk yapay zeka referans uygulamalarını sunarak, yazılım tanımlı altyapıda gerçek zamanlı yapay zeka vaadini yerine getirmektedir.
Holoscan for Media ile başlayın.