SON DAKİKA

Nvdia

“NVIDIA Araştırma İş Akışları ve Modelleri ile Dexterous Robotların Uyum Sağlaması: R²D²”

Robot Kollari ve Uygulamaları

Robotik kollar, günümüzde montaj, paketleme, denetim ve daha birçok uygulamada kullanılmaktadır. Ancak, bu kollar genellikle belirli ve tekrarlayan görevleri yerine getirmek üzere önceden programlanmıştır. Çoğu ortamda artan uyum sağlama ihtiyacını karşılamak için, gerçek zamanlı verilere dayanarak karar verebilen ve davranışlarını ayarlayabilen perseptif kollara gereksinim bulunmaktadır. Bu sayede işbirlikçi ortamlarda görevler arasında daha fazla esneklik sağlanabilir ve tehlike farkındalığı ile birlikte güvenlik artışı elde edilebilir.

NVIDIA Robotik Araştırmaları ve Geliştirme

Bu yazı, NVIDIA Araştırma’ya ait birkaç robotik beceri, manipülasyon ve kavrama iş akışını ve yapay zeka modellerini incelemekte ve bunların uyum sağlama ve veri kıtlığı gibi önemli robot zorluklarını nasıl ele alabileceğini açıklamaktadır:

  • DextrAH-RGB: Streyo RGB verisinden seçici kavrama iş akışı.
  • DexMimicGen: Taklit öğrenimi (IL) kullanarak iki kollu hassas manipülasyon için veri üretim hattı. ICRA 2025‘te özel.
  • GraspGen: Farklı robotlar ve kavrayıcılar için 57 milyonun üzerinde sentetik kavrama verisi.

Dexterous Robotlar Nedir?

Dexterous robotlar, nesneleri hassasiyet, uyum sağlama ve verimlilikle manipüle eden robotlardır. Robotik beceri, ince motor kontrollere, koordinasyona ve genellikle yapılandırılmamış ortamlarda geniş bir görev yelpazesini yönetme yeteneğine bağlıdır. Robot becerisinin temel unsurları arasında tutma, manipülasyon, dokunsal hassasiyet, çeviklik ve koordinasyon bulunmaktadır.

Robot becerisi, üretim, sağlık ve lojistik gibi endüstrilerde insan benzeri hassasiyet gerektiren görevlerin otomasyonunda kritik bir öneme sahiptir.

NVIDIA Robotik Becerileri ve Manipülasyon İş Akışları

Hassas kavrama, robot bilimi için zorlu bir görevdir çünkü robotların çeşitli nesneleri hızla ve hassasiyetle manipüle etme yeteneğini gerektirir. Geleneksel yöntemler, yansıtıcı nesnelerle başa çıkmada zorluk çeker ve yeni nesnelere veya dinamik ortamlara iyi uyum sağlamaz.

NVIDIA Araştırma, bu zorlukları aşmak için sondan sona temel modeller ve akışlar geliştirmektedir. Bu modeller, nesneler ve ortamlar arasında sağlam bir manipülasyon için kullanılmaktadır.

DextrAH-RGB ile Hassas Kavrama

DextrAH-RGB, stereo RGB girdi verilerinden hassas kol-el kavraması gerçekleştiren bir iş akışıdır. Bu iş akışı sayesinde, politikalar tamamen simülasyonda eğitilmekte ve uygulamada yeni nesnelere genel bir şekilde uyum sağlamaktadır. DextrAH-RGB, farklı nesneler üzerinde geniş ölçekli simülasyonda eğitilmektedir.

Bu eğitim pipelini iki aşamaya bölmek mümkündür. İlk olarak, bir öğretmen politikası, takviye öğrenimi (RL) kullanılarak simülasyonda eğitim almaktadır. Bu öğretmen, geometrik bir kumaş eylem alanında hareket eden bir kumaş rehber politika(FGP) olarak görev yapmaktadır. Geometrik kumaşlar, hareketi eklem pozisyonu, hızı ve ivme sinyalleri olarak tanımlayan ve robotun kontrolcüsüne komutlar olarak iletebilen bir tür vektörleştirilmiş düşük seviyeli kontrole olanak tanır. Bu sayede, uygulamada güvenlik ve reactivity sağlanarak hızlı iterasyon mümkün olmaktadır.

Öğretmen politikasında, dünyanın fiziğini akıl yürüten ve uyum sağlayan bir LSTM katmanı bulunmaktadır. Bu, kavramaların yeniden tutulması ve kavrama başarılarının anlaşılması gibi düzeltici davranışları entegre etmeye yardımcı olur. Eğitim sürecinin ilk aşaması, alan rastgeleleştirmesinden faydalanarak dayanıklılığı ve uyum sağlamayı güclendirir; bunun için fiziksel ve görsel değişkenler ile bozulma parametreleri, öğretmen politikası eğitiminde çevresel zorlukları arttırmak için değiştirilmektedir.

Eğitimin ikinci aşamasında, öğretmen politikası, fotogerçekçi tiled rendering kullanılarak RGB tabanlı bir öğrenci politikasına damıtılmaktadır. Bu adımda, bir taklit öğrenme çerçevesi olan DAgger kullanılmaktadır. Öğrenci politikası, stereo kameradan gelen RGB görüntüleri alarak derinlik ve nesne pozisyonlarını dolaylı olarak çıkarabilmektedir.

An image of the DextrAH-RGB training pipeline, including Stage 1: Teacher Training; Stage 2: Student Training; Stage 3: Real-World Deployment.
DextrAH-RGB eğitim süreci

Simülasyondan Gerçekliğe Boston Dynamics Atlas MTS Robotu ile Geçiş

NVIDIA ve Boston Dynamics, DextrAH-RGB’yi eğitmek ve uygulamak için birlikte çalışmaktadır. Bu sistem, Atlas’ın üst gövdesinde dağıtılan genel bir politika ile sürülen zengin, sıfırdan simülasyondan gerçeğe geçiş kavrama yeteneklerine sahip bir robotik sistemi göstermektedir.

A GIF showing the teacher policy for Atlas being trained at scale using Isaac Lab.
Atlas için öğretmen politikasının NVIDIA Isaac Lab kullanılarak büyük ölçekte eğitimi

Sistem, Atlas’ın üç parmaklı kavrayıcılarıyla güçlendirilen çeşitli kavramalar sergilemekte olup, hem hafif hem de ağır nesneleri kavrama yeteneğine sahiptir. Ayrıca, başarısızlık tespiti ve yeniden deneme davranışlarını da gösterebilmektedir.

Boston Dynamics Atlas MTS robotu, DextrAH-RGB kullanarak endüstriyel nesneleri başarıyla kavrıyor

DexMimicGen ile İki Kollu Manipülasyon Veri Üretimi

DexMimicGen, iki kollu manipulasyon veri üretimi için küçük bir sayıdaki insan gösterimlerini kullanarak büyük ölçekli yol veri setleri oluşturan bir iş akışıdır. Amaç, manuel veri toplama görevini azaltmak ve robotların simülasyonda eylemleri öğrenmesini sağlamak suretiyle bu bilgilerin gerçeğe aktarılmasını sağlamaktır.

DexMimicGen, veri setlerini oluşturmak için simülasyon tabanlı artırma kullanmaktadır. İlk olarak, bir insan gösterimi, bir teleoperasyon cihazı kullanarak birkaç gösterim toplar. DexMimicGen daha sonra simülasyonda gösterim yollarının büyük bir veri seti oluşturur. Örneğin, ilk yayında, araştırmacılar sadece 60 insan gösterimi kullanarak 21K gösterim oluşturmuştur. Son olarak, bu üretilen veri seti üzerinde bir politika eğitilerek belirli bir manipülasyon görevini gerçekleştirmek üzere fiziksel bir robota dağıtılmaktadır.

An overview diagram of DexMimicGen, including four images labeled Real-World Teleoperation and Simulation Replay (top) and Real-World Deployment and Generated Trajectories (bottom) with Digital Twin Sim2Real arrows between.
DexMimicGen iş akışı

İki kollarla manipülasyon, nesnelerin hassas koordinasyonu gerektiği için zorludur. Paralel görevler, her kolun farklı bir nesneyi alma ihtiyacını içerirken, senkronize görevler, büyük bir nesneyi kaldırmak için kolların hareket ve zamanlama senkronizasyonunu gerektirir. Sıralı görevler ise, bir kolun bir kutuyu hareket ettirip diğer kolun içine bir nesne koyması gibi belirli bir sırayla tamamlanması gereken alt görevler içermektedir.

DexMimicGen, ‘paralel, koordine ve sıralı’ alt görevlerden oluşan taksonomiyi kullanarak bu farklı gereksinimleri dikkate almaktadır. Bu yöntem, veri üretimi sırasında tam hizalama ve mantıklı görev icrası sağlamak için bağımsız kol alt görevleri için asenkron yürütme stratejileri, koordine görevleri için senkronizasyon mekanizmaları ve sıralı alt görevler için sıralama kısıtlamaları kullanmaktadır.

A GIF showing a humanoid robot executing the can sorting task successfully using a model trained on data generated using DexMimicGen.
Kutu ayıklama görevini başarıyla gerçekleştiren humanoid robot

Gerçek dünyada dağıtıldığında, DexMimicGen, iki kolları kullanarak kutu ayıklama görevinde %90 başarı oranına ulaşmıştır. Bunun yanında, sadece insan gösterimleri ile eğitilen bir model %0 başarı oranı elde etmiştir. Bu gözlemler, DexMimicGen’in insan çabasını azaltmada ve karmaşık manipülasyon görevleri için sağlam robot öğrenimini sağlamada etkinliğini vurgulamaktadır.

GraspGen Verisi ve Çoklu Robotlar ile Kavrayıcılar

Araştırmayı desteklemek amacıyla, GraspGen Hugging Face üzerinde yeni bir simüle veri seti sağlayarak, üç farklı kavrayıcı için 57 milyon kavrama ile verimliliği artırmaktadır. Veri seti, farklı nesne modelleri için 6D kavrayıcı dönüşümleri ve başarı etiketleri içermektedir.

An image showing icons representing proposed grasps for different objects in the dataset.
Veri setindeki farklı nesneler için önerilen kavramalar

Üç kavrayıcı: Franka Panda kavrayıcısı, Robotiq 2F-140 endüstriyel kavrayıcısı ve tek temaslı vakum kavrayıcısıdır. GraspGen verisi tamamen simülasyonda üretilmiş olup, veri setlerini büyütme ve çeşitlendirme açısından otomatik veri üretiminin faydalarını göstermektedir.

An image of three grippers in the simulated GraspGen dataset showing the coordinate frame convention. Left: Robotiq 2F-140 gripper, middle: a single-contact suction gripper, right: Franka Panda gripper.
Simüle GraspGen veri setindeki üç kavrayıcının koordinat sistemi: Robotiq 2F-140 kavrayıcısı (sol), tek temaslı vakum kavrayıcısı (orta), ve Franka Panda kavrayıcısı (sağ)

Sonuç

Artan uyum sağlama gereksinimleri doğrultusunda, robot kolların gerçek zamanlı verilere dayanarak karar verebilmek ve davranışlarını ayarlamak amacıyla gelişmeleri gerekmektedir. Bu yazıda, robotik beceri, manipülasyon ve kavrama iş akışları ve yapay zeka modelleri değerlendirildi ve bu yapıların uyum ile veri kıtlığı gibi önemli sorunları nasıl çözdüğü incelendi.

Daha fazla bilgi edinmek için aşağıdaki kaynakları kontrol edebilirsiniz:

Bu yazı, NVIDIA Araştırma ve Robotik alanındaki en son gelişmeleri daha derinlemesine anlamak için hazırlanmış NVIDIA Robotik Araştırmaları ve Geliştirme Bülteni (R2D2)nin bir parçasıdır.

Gelişmeleri takip etmeyi ve bültenimize abone olmayı unutmayın. NVIDIA Robotik’i YouTube, Discord ve NVIDIA Geliştirici Forumları üzerinden takip edebilirsiniz. Robotik yolculuğunuza başlamak için ücretsiz NVIDIA Robotik Temel Eğitim kurslarına katılın.

Teşekkürler

Bu yazıda belirtilen araştırmalara katkılarından dolayı Arthur Allshire, Mohak Bhardwaj, Mark Carlson, Yu-Wei Chao, Clemens Eppner, Gina Fay, Jim Fan, Dieter Fox, Ankur Handa, Zhenyu Jiang, Kevin Lin, Michael Lutter, Ajay Mandlekar, Adithyavairavan Murali, Nathan Ratliff, Fabio Ramos, Alberto Rodriguez, Ritvik Singh, Balakumar Sundaralingam, Karl Van Wyk, Weikang Wan, Wentao Yuan, Jun Yamada, Yuqi Xie, Zhenjia Xu, ve Yuke Zhu’ya teşekkür ederiz.

Kaynak

Nvdia Blog

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri