“Generatif AI ve Akıl Yürütme ile Bilgisayarlı Görüntü İşleme Süreçlerini Entegre Etme Yöntemleri”

Generatif AI ile Video Analizinin Geleceği

Generatif AI, mevcut video akışlarını analiz etmek için yeni imkanlar sunuyor. Video analitiği artık nesne sayımından, ham video içeriklerini anlık anlayışa dönüştürmeye evriliyor. Bu sayede daha etkili ve harekete geçirici içgörüler elde edilebiliyor.

NVIDIA AI Mavikırığı: Video Arama ve Özetleme

NVIDIA AI Mavikırığı, görsel dil modelleri (VLM’ler), büyük dil modelleri (LLM’ler) ve geri alma artırıcı üretim (RAG) ile optimize edilmiş alma, geri alım ve depolama boru hatlarını bir araya getiriyor. NVIDIA Metropolis’in bir parçası olarak, hem kaydedilmiş hem de gerçek zamanlı video anlayışını destekliyor.

Yeni Özellikler ile Geliştirilmiş Video Analizi

VSS Mavikırığı’nın önceki sürümleri, verimli video alma, bağlama duyarlı RAG, bilgisayarla görme (CV) boru hattı ve ses transkripsiyonu gibi yetenekler sunuyor. Bu yazıda, geliştiricilere yeni dört büyük güncelleme ile sunulan olanaklar detaylandırılacak:

  1. Fiziksel dünyanın anlayışını artırma: VSS, gelişmiş fiziksel AI akıl yürütme ve sahne anlama kabiliyetleri sunan NVIDIA Cosmos Reason ile entegre oldu.
  2. Soru-Cevap’ı geliştirme: Yeni bilgi grafiği özellikleri ve çoklu kamera destekleri, geçirgenlik, iyileştirilmiş bilgi grafiği oluşturma ve agentic tabanlı grafik analiz ile güçlendirildi.
  3. Yan olay inceleyici ile sınırda generatif AI’yi serbest bırakma: CV boru hatları tarafından bulunan ilgi çekici olayları gözden geçirme ve bağlamsal iç görüşler sağlama imkanı sunuyor.
  4. Genişletilmiş donanım desteği ile dağıtım: VSS, NVIDIA Blackwell platformunda bulunan çoklu sistemlerde kullanılabilir duruma geldi. Bu, NVIDIA Jetson Thor, NVIDIA DGX Spark ve NVIDIA RTX Pro 6000 iş istasyonları için geçerlidir.

Cosmos Reason ile Fiziksel Dünyayı Anlamak

Cosmos Reason, fiziksel AI için 7 milyar parametreli açık ve özelleştirilebilir bir akıl yürütme VLM’dir. Bu model, görsel AI ajanlarının insan gibi akıl yürütebilmesini sağlıyor. Cosmos Reason, geliştiricilerin sanal ajanlar oluşturarak, tonlarca kayıtlı video veya milyonlarca canlı akışla analiz yapabilmesini sağlıyor.

Bilgi Grafiği ile Soru Cevap Sürecinin Geliştirilmesi

Büyük video verisini yutmak zorlayıcı olabilir çünkü bu veriler yapılandırılmamış, sürekli ve aşırı yüksek hacimlidir. VSS, bir video veya canlı akışın küçük parçalara ayrılmasını sağlayarak, her parçanın üstüne zengin bir açıklama veya başlık oluşturan bir VLM kullanıyor. Daha sonra büyük bir dil modeli, bu başlıklardan gerekli bilgileri çıkararak bir bilgi grafiği oluşturuyor.

VSS 2.4, bilgi grafiği oluşturulurken oluşan gereksiz tekrarları ve bağlantıları temizleyerek, Q&A doğruluğunu artırıyor.

CV Boru Hatlarını VSS Olay İnceleyici ile Zenginleştirme

Küçük ölçekli ve kenar dağıtımları için, yeni VSS Olay İnceleyici özelliği, mevcut bilgisayarla görme boru hatlarına kolayca entegre olabiliyor. Bu, düşük gecikmeli uyarı ve VLM ile video bölümleri üzerinde doğrudan soru-cevap yapma imkanı sunuyor.

Genişletilmiş Donanım Desteği ile Esnek Dağıtım

VSS Mavikırığı 2.4 sürümü, NVIDIA Blackwell platformundaki çeşitli sistemleri tamamen destekliyor. Bu, NVIDIA RTX Pro 6000 sunucu ve iş istasyonu sürümleri için geçerli. Ayrıca, NVIDIA DGX Spark desteği de geliyor.

Görsel Ajanik AI ile Başlamak

VSS Mavikırığı 2.4 sürümü, kenarda, soru-cevap doğruluğunda ve çoklu kamera anlayışında gelişmelerle yeni görsel ajanik AI yetenekleri sunuyor. Bu yeni araçlarla, geliştiriciler VSS’yi mevcut bilgisayarla görme boru hatları içinde, düşük gecikmeli uyarılar sağlamak için akıllıca kullanabilir.

VSS Mavikırığı’na hızlı bir başlangıç yapmak için NVIDIA Brev Launchable‘ı kullanabilirsiniz. Bu araç, VSS’yi başlatmaya, Web arayüzüne erişmeye ve API’leri kullanmaya yönelik yol gösterici dokümantasyon sunuyor.

Kaynak

Nvdia Blog

Exit mobile version