Günümüzde robotik kollar, montaj, paketleme, muayene gibi birçok uygulamada kullanılmaktadır. Ancak bu robotlar hala belirli ve genellikle tekrarlayan görevleri yerine getirmek için önceden programlanmıştır. Çoğu ortamda artan uyum sağlama ihtiyacını karşılamak için, algılayıcı kolların, gerçek zamanlı verilere dayanarak kararlar vermesi ve davranışlarını ayarlaması gerekmektedir. Bu sayede, işbirlikçi ortamlarda daha fazla esneklik sağlanmakta ve tehlike farkındalığı sayesinde güvenlik artırılmaktadır.
NVIDIA Robotik Araştırma ve Geliştirme Bülteni (R2D2) bu sayısında, robotların ustalık, manipülasyon ve tutma iş akışları ile AI modellerine odaklanarak, bu modellerin adaptasyon ve veri kıtlığı gibi temel robot zorluklarını nasıl ele alabileceğini incelemektedir:
- DextrAH-RGB:Stereo RGB girişi kullanarak ustaca kavrama için bir iş akışı.
- DexMimicGen: Bimanual ustalık manipülasyonu için taklit öğrenimi (IL) kullanarak veri üretim hattı. ICRA 2025‘te yer aldı.
- GraspGen: Farklı robotlar ve kavrayıcılar için 57 milyonun üzerinde sentetik kavrama verisi içeren bir veri seti.
Ustalık Robotları Nedir?
Ustalık robotları, nesneleri hassasiyetle, uyum sağlayarak ve verimli bir şekilde manipüle eder. Robotların ustalığı; ince motor kontrolü, koordinasyon ve yapılandırılmamış ortamlarda geniş bir görev yelpazesini yönetebilme becerisine dayanır. Robot ustalığının önemli yönleri arasında kavrama, manipülasyon, dokunsal hassasiyet, çeviklik ve koordinasyon yer alır.
Robot ustalığı, üretim, sağlık hizmetleri ve lojistik gibi endüstrilerde büyük öneme sahiptir ve insan benzeri hassasiyet gerektiren görevlerde otomasyonu mümkün kılar.
NVIDIA’nın Robot Ustalığı ve Manipülasyon İş Akışları ile Modelleri
Dexterous grasping (ustaca kavrama), robot teknolojisinde zorlu bir görevdir çünkü robotların farklı nesneleri hem hassas hem de hızlı bir şekilde manipüle etmesi gerekmektedir. Geleneksel yöntemler, yansıtıcı nesnelerle başa çıkmakta zorluk çeker ve yeni nesnelere veya dinamik ortamlara iyi genelleme yapamaz.
NVIDIA Araştırma, nesneler ve ortamlar arasında sağlam manipülasyonları mümkün kılan uçtan uca temel modeller ve iş akışları geliştirmektedir.
DextrAH-RGB ile Ustaca Kavrama
DextrAH-RGB, stereo RGB girişi kullanarak ustaca kol-el kavramasını gerçekleştiren bir iş akışıdır. Bu iş akışı sayesinde politikalar tamamen simülasyonda eğitilmektedir ve dağıtım aşamasında yeni nesnelere genelleme yapabilmektedir.
Eğitim süreci iki aşamadan oluşmaktadır. İlk olarak, takviye öğrenimi (RL) kullanılarak simülasyonda bir öğretici politika eğitilmektedir. Öğretici, bir geometrik kumaş eylem uzayında hareket eden ayrıcalıklı bir politikadır. Geometrik kumaşlar, robotun kontrol cihazına iletilen hareketi, eklem pozisyonu, hızı ve ivmesi olarak tanımlayan bir düşük seviyeli kontrol türüdür. Bu, dağıtım aşamasında güvenlik ve tepkisel olmayı garantileyerek hızlı iterasyona olanak tanır. Ayrıca çarpışma önleme ve hedefe ulaşma davranışlarını uygulamaya yerleştirmektedir.
Öğretici politikanın bir LSTM katmanı, dünya fiziğini düşünme ve uyarlama becerisini kazandırmaktadır. Bu, yeniden kavrama ve kavrama başarısını anlama gibi düzeltici davranışları dahil etmeye yardımcı olur, böylece mevcut dinamiklere tepki verebilir. Eğitim sürecinin ilk aşaması, alan rastgeleleştirmesi kullanılarak sağlamlık ve uyarlanabilirliği sağlamakta, fiziksel ve görsel parametreler ile bozulma parametreleri değiştirilmektedir.
Eğitimin ikinci aşamasında, öğretici politika, fotorealistDAgger kullanarak bir RGB bazlı öğrenci politikasına damıtılmaktadır. Öğrenci politika, bir stereo kameradan RGB görüntüleri alarak derinlik ve nesne pozisyonlarını dolaylı olarak tahmin edebilme yeteneğine sahiptir.

Simülasyondan Gerçeğe: Boston Dynamics Atlas MTS Robot
NVIDIA ve Boston Dynamics, DextrAH-RGB’yi eğitmek ve dağıtmak için işbirliği yapmaktadır. Şekil 2 ve Video 2, Atlas’ın üst gövdesinde dağıtılan genel bir politika ile güçlü, sıfırdan simülasyondan gerçeğe kavrama yeteneğini sergileyen bir robot sistemi göstermektedir.

Bu sistem, Atlas’ın üç parmağından oluşan kavrayıcıları sayesinde hem hafif hem de ağır nesneleri kavrayabilme yeteneği sergilemekte ve gelişmekte olan hata algılama ve yeniden deneme davranışlarını göstermektedir.
DexMimicGen ile Bimanual Manipülasyon Veri Üretimi
DexMimicGen, bimanual manipülasyon veri üretimi için bir iş akışıdır ve az sayıda insan gösterimini kullanarak büyük ölçekli yaşam yolları veri setleri üretmektedir. Amaç, robotların simülasyonda hareketler öğrenmesini sağlamak ve bunu gerçek dünyaya taşımaktır. Bu iş akışı, bimanual ustalık robotları için veri kıtlığı sorununu ele almaktadır.
DexMimicGen, veri setleri oluşturmak için simülasyona dayalı artırma kullanmaktadır. Öncelikle, bir insan demonstratörü bir teleoperasyon cihazı kullanarak birkaç gösterim toplar. Ardından, DexMimicGen, bu gösterimlerden büyük bir veri seti oluşturur. Örneğin, yayınlanan ilk çalışmada, araştırmacılar, sadece 60 insan gösteriminden 21.000 gösterim üretmiştir. Son olarak, oluşturulan veri seti kullanılarak bir politika, manipülasyon görevini gerçekleştirmek için IL ile eğitilmekte ve bir fiziksel robota dağıtılmaktadır.

Bimanual manipülasyon, iki kol arasında hassas koordinasyon gerektirdiği için zorlu bir görevdir. Her iki kolda da farklı nesneleri alma gibi paralel görevler, bağımsız kontrol politikaları gerektirir. Büyük bir nesneyi kaldırmak gibi koordine edilmiş görevler, kolların hareketini ve zamanlamasını senkronize etmeyi gerektirir. Sıralı görevler ise, bir elde kutu taşırken diğer elde bir nesne yerleştirmek gibi bir dizi alt görevin belirli bir sırayla tamamlanmasını gerektirir.
DexMimicGen, veri üretimi sırasında bu değişken gereksinimleri ‘paralel, koordinasyon ve sıralı’ alt görevler sınıflandırması kullanarak dikkate almaktadır. Bu, bağımsız kol alt görevleri için asenkron yürütme stratejilerini, koordinasyon görevleri için senkronizasyon mekanizmalarını ve sıralı alt görevler için sıralama kısıtlamalarını kullanmaktadır. Bu yöntem, veri üretilirken hassas hizalama ve mantıklı görev yürütümü sağlamaktadır.

Gerçek dünyada dağıtıldığında, DexMimicGen, bir humanoid robotun, gerçek-sim-gerçek hattı kullanarak konserve ayıklama görevinde %90 başarı oranı elde etmesini sağlamıştır. Karşılaştırma yapmak gerekirse, yalnızca insan gösterimleri kullanılarak eğitilen model %0 başarı göstermiştir. Bu gözlemler, DexMimicGen’in insan çabasını azaltırken karmaşık manipülasyon görevleri için sağlam robot öğrenimini sağladığını göstermektedir.
GraspGen Veri Seti: Birden Fazla Robot ve Kavrayıcı
Araştırmaları desteklemek amacıyla GraspGen, Hugging Face’‘de üç farklı kavreyici için 57 milyon kavramayı içeren yeni bir simüle veri seti sunmaktadır. Bu veri seti, farklı nesne ağları için 6D kavrayıcı dönüşümleri ve başarı etiketleri içermektedir.

Üç kavrayıcı; Franka Panda kavrayıcısı, Robotiq 2F-140 endüstriyel kavrayıcısı ve tek temaslı emme kavrayıcısıdır. GraspGen, tamamen simülasyonda üretilmiş olup, veri setlerinin boyut ve çeşitlilik açısından ölçeklenmesinin otomatik veri üretimi ile sağladığı faydaları göstermektedir.

Özet
Artan uyum sağlama ihtiyacını karşılamak amacıyla robot kolların, gerçek zamanlı verilere dayanarak karar vermesi ve davranışlarını ayarlaması gerekmektedir. Bu yazıda, robot ustalığı, manipulasyon ve kavrama iş akışları ile AI modellerinin temel robot zorlukları olan adaptasyon ve veri kıtlığını nasıl ele aldıklarına dair birkaç örnek incelemiştir.
Daha fazla bilgi edinmek için aşağıdaki kaynaklara göz atabilirsiniz:
- DextrAH-RGB
- DexMimicGen
- GraspGen
Bu yazı, NVIDIA Araştırma tarafından fiziksel AI ve robotik uygulamaları üzerindeki son gelişmeleri daha ayrıntılı bir şekilde anlamak için hazırlanan NVIDIA Robotik Araştırma ve Geliştirme Bülteni (R2D2)’nin bir parçasıdır.
Gelişmeleri takip etmek için bültene abone olmayı ve NVIDIA Robotik’i YouTube, Discord ve NVIDIA Geliştirici Forumları üzerinde takip etmeyi unutmayın. Robotik yolculuğunuza başlamak için ücretsiz NVIDIA Robotik Temel Kurslarını inceleyebilirsiniz.
Teşekkürler
Bu yazıda bahsedilen araştırmalara katkıları için Arthur Allshire, Mohak Bhardwaj, Mark Carlson, Yu-Wei Chao, Clemens Eppner, Gina Fay, Jim Fan, Dieter Fox, Ankur Handa, Zhenyu Jiang, Kevin Lin, Michael Lutter, Ajay Mandlekar, Adithyavairavan Murali, Nathan Ratliff, Fabio Ramos, Alberto Rodriguez, Ritvik Singh, Balakumar Sundaralingam, Karl Van Wyk, Weikang Wan, Wentao Yuan, Jun Yamada, Yuqi Xie, Zhenjia Xu ve Yuke Zhu’ya teşekkür ederim.