SON DAKİKA

Nvdia

“Algısal Yapay Zeka için Üretken AI Destekli Sentetik Veri Pipeline’ı Nasıl Oluşturulur?”

Otonom makineleri, robotlar ve otonom araçlar gibi, çalıştırmak için fiziksel yapay zeka (AI) modellerinin eğitilmesi büyük miktarda veriye ihtiyaç duyar. Ancak, çeşitliliğe sahip büyük veri setlerini elde etmek zor, zaman alıcı ve maliyetli olabilir. Veriler genellikle gizlilik kısıtlamaları veya kaygılar nedeniyle sınırlıdır veya yenilikçi kullanım durumları için mevcut olmayabilir. Ayrıca, mevcut veriler potansiyel durumların tamamına uygulanmayabilir ve bu da modelin farklı senaryolara doğru bir şekilde yanıt verme yeteneğini kısıtlayabilir.

Sentetik veri, dijital ikizler aracılığıyla bilgisayar simülasyonları ile üretilerek gerçek dünya verisinin bir alternatifi olarak sunulur; bu, geliştiricilerin fiziksel AI model eğitimini hızlandırmasına olanak tanır. Farklı düzen, varlık yerleşimi, konum, renk, nesne boyutu ve ışık koşulları gibi birçok değişkeni değiştirerek geniş ve çeşitli veri setleri hızla oluşturulabilir. Bu veriler ardından genel bir modelin oluşturulmasına yardımcı olabilir.

Sentetik Veri Üretim Sürecinin Hızlandırılması

Fiziksel kesinlik sağlamak, algı AI modellerinin eğitiminde simülasyon ile gerçek dünya arasındaki boşluğu kapatmak için hayati önem taşır. Tipik bir sentetik veri üretim (SDG) süreci, başlangıçta sanal bir ortamda nesnelerin dikkatlice yeniden oluşturulması ile başlar. Ardından, bu nesnelerin gerçek dünya benzerlerini doğru bir şekilde taklit eden malzemeler, dokular ve diğer nitelikler oluşturulmalıdır.

Sahne oluşturulduktan sonra, geliştiriciler alan rastgeleleştirme teknikleri kullanarak ışık, renkler ve dokular gibi yönleri sistematik olarak değiştirir. Bu rastgeleleştirme, modelin genelleme yeteneğini artırmak için çeşitli, etiketlenmiş görüntüler üretir. Süreç, istenen ana performans göstergelerine (KPI’lar) ulaşıldığında, sürekli olarak sentetik verilerin iyileştirilmesi ve modelin eğitimi ile döngüsel olarak devam eder.

Ancak geleneksel SDG yöntemlerinin etkinliğine rağmen birçok aşama—sahne oluşturma ve parametre rastgeleleştirme gibi—hala manuel ve zaman alıcıdır. Yapay zeka, bu süreci belirgin şekilde kolaylaştırmak için güçlü bir çözüm sunar.

Gelişmiş difüzyon modelleri, Edify ve SDXML gibi, metin veya görüntü açıklamalarından yüksek kalitede görsel içerik hızla üretebilir. Doğru yönergeler sağlandığında, bu modeller görüntü parametrelerini programatik olarak değiştirme konusunda son derece başarılıdır; düzen, varlık yerleşimi, renk şemaları, nesne boyutları ve ışık koşulları gibi unsurlar üzerinde büyük ölçüde manuel çabayı azaltarak çalışabilirler.

Gelişmiş Görüntü Geliştirme ile Çeşitlendirilmiş Veri Setleri

Ayrıca, yapay zeka, tüm 3D sahneyi değiştirmeden etkili bir görüntü artırma işlemi sağlar. Basit metin tabanlı komutlar kullanarak geliştiriciler gerçekçi detaylar ekleyebilir, örneğin yüzey pası veya seçici bulanıklık efektleri uygulayabilir. Bu yaklaşım, çeşitli veri setlerinin oluşturulmasını dramatik şekilde hızlandırmaktadır.

Örneğin, Şekil 1, bir temel görüntünün her biri farklı bir zemin ve forklift rengi ile dört farklı şekilde nasıl artırıldığını göstermektedir. Geleneksel olarak, bir teknik sanatçının bu tür değişiklikleri uygulaması ve yeni görüntüler oluşturması birkaç saat alır. Ancak yapay zeka bu işlemi çok daha kısa sürede gerçekleştirir, bu da üretkenliği ve veri setinin çeşitliliğini büyük ölçüde artırır.

Four synthetically generated images, each with a different floor and different color of forklift (green, blue, yellow, white).
Şekil 1. Farklı zemin tipleri ve forklift renklerini gösteren sentetik olarak üretilmiş görüntüler

Referans İş Akışı ve Uygulamaları

Referans iş akışı, robotik alanında bilgisayarla görme modelleri eğiten geliştiriciler için uygundur ve ayrıca akıllı alanlar için bilgisayarla görme uygulamalarını da içerir. Aşağıdaki bölüm, referans iş akışının ana adımlarını ve temel teknolojilerini tanımlamaktadır.

A reference architecture for training robot foundation models with Isaac Sim from scene generation to 3D domain randomization to simulation, to 2D domain randomization and training.
Şekil 2. NVIDIA Isaac Sim ile robot temel modellerinin eğitimi için sonlu referans iş akışı
  • Sahne oluşturma: Kapsamlı bir 3D depo sahnesi, raflar, kutular ve paletler gibi temel varlıkları içerecek şekilde tasarlanır. Bu temel ortam, 3D NIM mikro hizmetleri kullanılarak dinamik olarak genişletilebilir, böylece çeşitli nesnelerin eklenmesi ve 360° HDRI arka planlarının dahil edilmesi sağlanır.
  • Alan rastgeleleştirme: Geliştiriciler, alan rastgeleleştirme uygulamak için OpenUSD özel bir büyük dil modeli olan USD Code NIM’i kullanabilir. Bu güçlü araç hem OpenUSD ile ilgili soruları yanıtlar hem de sahnedeki değişiklikleri yapmak için USD Python kodu üreterek Omniverse Replicator içindeki çeşitli sahne parametrelerini programlı olarak değiştirme işlemini kolaylaştırır.
  • Veri üretimi: Üçüncü adım, başlangıçta etiketlenmiş görüntüler setinin dışa aktarılmasıdır. Replicator, 2D sınır kutuları, anlamsal segmentasyon, derinlik haritaları, yüzey normalleri ve daha pek çokları gibi geniş bir yerleşik etiketleyici yelpazesi sunar. Çıktı formatı (sınır kutuları veya segmentasyon maskeleri gibi) belirli model gereksinimlerine veya kullanım durumuna bağlıdır. Veri, standart çıktı için BasicWriter, KITTI formatı için KittiWriter veya COCO formatı için özel yazarlar kullanılarak dışa aktarılabilir.
  • Veri artırma: Son aşamada, geliştiriciler SDXL ve Edify gibi yapay zeka modellerinden yararlanabilir, bu süreç ComfyUI ile desteklenir; bu platform, difüzyon modeli iş akışlarının oluşturulması ve uygulanması için çok yönlü bir açık kaynak aracıdır.

Bu iş akışı kılavuzunu kullanarak, algı AI modellerinin eğitimi için kullanabileceğiniz özel bir SDG pipeline geliştirmek mümkündür. Bu referans iş akışını uygulayarak, hem siz hem de müşteriniz aşağıdaki avantajlardan faydalanabilecektir:

  • AI model eğitiminin hızlandırılması: Veri açığını aşın ve AI model geliştirmeyi hızlandırın, bu süreçte metin, görsel ve fiziksel AI modellerini eğitmek için gereken veri edinim ve etiketleme maliyetlerini düşürün.
  • Gizlilik ve güvenlik: Gizlilik sorunlarını ele alın ve gerçek dünyayı temsil eden çeşitli sentetik veri setleri oluşturarak ön yargıyı azaltın.
  • Model doğruluğunun artırılması: Nadir ama kritik köşe durumları da dahil olmak üzere, toplaması zor olan çeşitli verilerle eğiterek son derece doğru ve genelleştirilmiş AI modelleri oluşturun.
  • Ölçeklenebilirlik: Kullanım durumunuza uygun olarak, üretim, otomotiv, robotik ve daha fazlasında otomatik bir işlemle veri oluşturun.

Adım adım başlamak için Sentetik Veri Üretimi için Generatif AI Referans İş Akışı nu inceleyebilirsiniz.

Gelişmeleri takip etmek için bültenimize abone olun, ayrıca NVIDIA Robotik’i YouTube, Discord ve NVIDIA Geliştirici Forumları üzerinden takip edin.

Kaynak

Nvdia Blog

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri