Waymo ve Google Gemini AI İşbirliğiyle Robotaksilerine Yeni Bir Boyut
Waymo, otonom “robotaksileri” için Google Gemini AI’yı kullanacağını belirtti. Şirket, otonom araçları için Google’nın çok modlu büyük dil modeli (MLLM) Gemini’den veri çekecek yeni bir eğitim modeli geliştirmektedir.
Waymo, MLLM’lerin Robotaksilerine Yardımcı Olacağını Açıklayan Yeni Bir Araştırma Makalesi Yayınladı
Waymo LLC, daha önce Google Otonom Araç Projesi olarak biliniyordu. Amerikan otonom sürüş teknoloji şirketi olan Waymo, yolculuları yoğun yollarda güvenli bir şekilde taşımak için donanım ve yazılımını kademeli olarak robotaksiler için inşa etmektedir.
Waymo, The Verge tarafından bildirildiği üzere yeni bir araştırma makalesi yayınladı. EMMA adlı “Autonomous Driving için Doğrudan İki Modlu Model” adlı araştırma makalesi, otonom araçlar için özel bir MLLM’ye atıfta bulunmaktadır.
Bu yeni doğrudan iki modlu eğitim modeli sensör verilerini işleyecek ve otonom araçlar için “gelecekteki rotaları” üretecektir. Bu, Waymo’nun sürücüsüz araçlarının yolda akıllı kararlar almasına yardımcı olacaktır. Waymo robotaksileri, nereye gideceklerini ve engellerden nasıl kaçınacaklarını önceden tahmin edebileceklerdir.
Google Gemini Waymo’ya Nasıl Yardımcı Olacak?
Birkaç yıldır, sürücüsüz araçlar için algoritmalar kritik işlevleri ele almak için bölümsel çözümler veya modüller kullanmaktadır. Başka bir deyişle, teknoloji şirketleri algılama, haritalandırma, tahmin ve planlama gibi konuları birbirinden bağımsız olarak ele almayı denemişlerdir.
Bu yaklaşım, otonom araçlar için problemleri çözmede yardımcı olmuştur. Ancak, bu yaklaşımla şirketler çözümlerini ölçeklendirirken zorluklarla karşılaşmışlardır. Çünkü Waymo araştırma makalesinde belirtildiği gibi, “modüller arasında biriken hatalar ve sınırlı ara modül iletişimi” yüzünden sorunlar yaşamışlardır.
Ayrıca, “önceden tanımlanmış” parametreler, bu tür çözümlerin “yeni ortamlara” yanıt vermede zorlanmasına neden olmuştur çünkü onlar “uyum sağlamakta” zorluk çekmişlerdir. Google Gemini, Generatif Yapay Zeka (Gen AI)’dır. Bu, arama devinin internetten geniş veri setlerinde eğittiği “genelci” bir AI’dır.
İkinci olarak, Gen AI platformları, “zincirli düşünce akıl yürütme” gibi teknikler aracılığıyla “üstün” düşünme kabiliyetleri sergilemiştir, Waymo önermiştir. Basitçe söylemek gerekirse, Gemini insan düşünme şeklini taklit edebilir ve bu nedenle LLM “bir sürücü gibi düşünebilir”.
Google Gemini, Waymo’ya yardımcı olabilir olsa da, EMMA AI’in sürekli olarak yapması gereken yeni verilerle uyumlu olması gerekecektir. Daha spesifik olarak, Waymo 3D sensör girişlerini lidar veya radar aracılığıyla entegre etmede zorluklar yaşamıştır.