Yapay Zeka (YZ), endüstrileri, işletmeleri ve tüketici deneyimlerini farklı şekillerde dönüştürüyor. **Generatif YZ modelleri**, analitik yetenekler geliştirmeye yönelirken, agentic YZ yeni sonuç odaklı iş akışlarını mümkün kılıyor ve fiziksel YZ kameralar, robotlar, dronlar ve araçlar gibi uç noktaların gerçek zamanlı kararlar almasına ve etkileşimde bulunmasına olanak tanıyor.
Tüm bu kullanım senaryolarının ortak noktası, yaygın, güvenilir, güvenli ve süper hızlı bir bağlantı ihtiyacıdır.
Telekomünikasyon ağları, fronthaul kablosuz erişim ağı aracılığıyla veya tamamen bağımsız YZ çıkarım hareketi olarak halka açık veya özel buluttan geri yönlendirilen YZ trafiğine hazırlıklı olmalıdır.
Yerel kablosuz altyapılar, YZ çıkarım işlemlerinin işlenmesi için ideal bir yer sunmaktadır. İşte bu noktada, telekom ağları için yeni bir yaklaşım olan YZ radyo erişim ağı (AI-RAN) öne çıkmaktadır.
Geleneksel CPU veya ASIC tabanlı RAN sistemleri sadece RAN kullanımı için tasarlanmış olup, günümüzde YZ trafiğini işleyememektedir. AI-RAN, hem kablosuz hem de YZ iş yüklerini aynı anda çalıştırabilen bir GPU tabanlı altyapı sunarak, ağları tek amaçlıdan çok amaçlı alt yapılar haline getiriyor ve yerleri maliyet merkezlerinden gelir kaynaklarına dönüştürüyor.
Doğru türde teknolojiye stratejik yatırım yaparak, telekom şirketleri AI’yı endüstriler, tüketiciler ve işletmeler arasında yaratma, dağıtma ve tüketme konusunda kolaylaştıran bir YZ ağı olma yolunda ilerleyebilir. Bu zaman dilimi, telekom şirketlerinin merkezi ve dağınık altyapılarını yeniden şekillendirerek YZ eğitimi (üretim) ve YZ çıkarımı (dağıtım) için bir zemin oluşturma fırsatı sunuyor.
SoftBank ve NVIDIA’nın AI-RAN Ticaretine Hız Vermesi
SoftBank, AI-RAN vizyonunu gerçek hale getirerek, Fujisawa Şehri, Kanagawa, Japonya’da NVIDIA destekli donanım ve NVIDIA Aerial yazılımı temelinde bir başarılı açık alan denemesi gerçekleştirmiştir.
Bu başarı, AI-RAN ticarileşmesinde bir dizi adım atmayı ve teknoloji uygulanabilirliği, performansı ve para kazanma konusundaki endüstri gereksinimlerine karşılık gelen gerçek kanıtlar sunmayı sağlamıştır:
- Dünyanın ilk açık hava 5G AI-RAN alan denemesi, NVIDIA destekli bir bilişim platformu üzerinde çalıştırıldı. Bu, 5G çekirdek ile entegre bir tam yığın sanal 5G RAN yazılımına dayanan bir uçtan uca çözümdür.
- Taşıyıcı sınıfı sanal RAN performansı elde edildi.
- YZ ve RAN çoklu kiralama ve orkestrasyonu başarıyla gerçekleştirildi.
- Mevcut kıyaslamalara göre enerji verimliliği ve ekonomik faydalar doğrulandı.
- AI-RAN altyapısında entegre bir AI pazarı açma çözümü sunuldu.
- Canlı bir AI-RAN ağında çalışan gerçek dünya YZ uygulamaları sergilendi.
SoftBank, yukarıda belirtilen başarıların ardından 2026 yılında dünya genelinde dağıtım için kendi AI-RAN ürününü ticarileştirmeyi amaçlıyor.
Diğer mobil ağ operatörlerinin AI-RAN yolculuklarına hızlıca başlamalarına yardımcı olmak için SoftBank, AI-RAN denemeleri için gerekli donanım ve yazılım bileşenlerinden oluşan bir referans kiti sunmayı planlıyor.
Uçtan Uca AI-RAN Çözümü ve Alan Sonuçları
SoftBank, donanım ve yazılım bileşenlerini NVIDIA ve ekosistem ortaklarından entegre ederek AI-RAN çözümünü geliştirmiştir. Bu çözüm, %100 yazılıma dayalı bir 5G vRAN yığını sunmaktadır. NVIDIA GH200 (CPU+GPU), NVIDIA Bluefield-3 (NIC/DPU) ve Spectrum-X ile fronthaul ve backhaul ağlarını içeren bir yapı ortaya konmuştur. 20 radyo birimi ve bir 5G çekirdek ağı ile entegre çalışmaktadır ve 100 mobil kullanıcı cihazı (UE) ile bağlantı kurulmaktadır.
Temel yazılım yığını aşağıdaki bileşenleri içermektedir:
- Yada SoftBank tarafından geliştirilen ve optimize edilen 5G RAN Katman 1 işlevleri; kanal eşlemesi, kanal tahmini, modülasyon ve ileri hata düzeltme, NVIDIA Aerial CUDA-İddialı-RAN kütüphanelerini kullanarak.
- Katman 2 işlevleri için Fujitsu yazılımı.
- Farklı türde uygulamaların aynı temel GPU bilişim altyapısında çalışmasını sağlamak için konteyner sanallaştırma katmanı olarak Red Hat’in OpenShift Container Platformu (OCP).
- RAN ve YZ iş yüklerinin talep ve mevcut kapasiteye dayanarak sorunsuz bir şekilde sağlanmasını sağlamak için SoftBank tarafından geliştirilen uçtan uca YZ ve RAN orkestratörü.
Altyapıyı oluşturan donanım, NVIDIA GH200 Grace Hopper Süper Çipi‘dir. Bu çip, dağıtılmış ve merkezi RAN senaryolarında çeşitli konfigürasyonlarda kullanılabilir. Bu uygulamada, bir rack içindeki çok sayıda GH200 sunucusu, AI ve RAN iş yüklerini aynı anda çalıştırmak üzere kullanılmaktadır, bu da birden fazla geleneksel RAN baz istasyonunu deploy etmekle karşılaştırılabilir.
Bu pilot uygulamada, her GH200 sunucusu, RAN sadece modda kullanıldığında 20 5G hücresini 100-MHz bant genişliği ile işleyebilmiştir. Her hücre için, ideal koşullarda 1.3 Gbps’lik en yüksek indirme performansı elde edilmiştir ve dış mekan dağıtımında 816 Mbps ile taşıyıcı sınıfı kullanılabilirlik gösterilmiştir.
AI-RAN Çoklu Kiralama Gerçekleştirildi
AI-RAN teknolojisinin ilkelerinden biri, RAN ve YZ iş yüklerini aynı anda ve taşıyıcı sınıfı performansına zarar vermeden çalıştırabilmektir. Bu çoklu kiralama, zaman veya alan bakımından olabilir: Yani kaynakları günün saatine göre veya hesaplama yüzdesine göre ayırmak anlamına gelir. Bu, talebe göre YZ ve RAN iş yüklerini sağlamak için bir orkestratör gereksinimini de içerir.
Fujisawa Şehri denemesinde, GH200 tabanlı YZ ve RAN işlemlerinin eşzamanlı olarak çalıştığı gösterilmiştir.
Her NVIDIA GH200 sunucusu, çoklu MIG’ler (Çoklu Örnek GPU) içermektedir. Bu, tek bir GPU’nun birden fazla izole GPU örneğine bölünmesine olanak tanır. Her bir örneğin kendine özgü kaynakları, bellek, önbellek ve hesaplama çekirdekleri vardır ve bağımsız olarak çalışabilir.
SoftBank orkestratörü, YZ ve RAN iş yüklerini çalıştırmak için bir veya daha fazla MIG’yi çalıştırmak üzere tam GPU’ları akıllıca atamakta ve gerektiğinde dinamik olarak geçiş sağlamaktadır. Ayrıca, belirli bir yüzdelik dilimi statik olarak ayırarak YZ ve RAN için atama yapmak mümkündür; örneğin, RAN için %60 ve YZ için %40 gibi.
amaç, kapasite kullanımını maksimum düzeye çıkarmaktır. AI-RAN ile, telekom şirketleri %33 kapasite kullanım oranına sahip geleneksel RAN ağlarına kıyasla neredeyse %100 kullanım oranına ulaşabilirler. Bu, dinamik orkestrasyon ve önceliklendirme politikaları sayesinde, tepe RAN yüklerini karşılayabilmeyi sağlamaktadır.
AI-RAN Pazar Yerinin Oluşturulması
Dağıtılmış AI-RAN altyapısında artık mevcut olan yeni YZ hesaplama kapasitesi ile, YZ talebinin bu AI hesaplama arzına nasıl getirileceği sorusu gündeme gelmektedir.
SoftBank, YZ iş yüklerini AI-RAN üzerinde dağıtmak ve yönetmek için NVIDIA YZ Enterprise tarafından desteklenen bir sunucusuz API kullanarak çözüm geliştirmiştir. Bu API, AI-RAN altyapısında barındırılmaktadır ve SoftBank E2E AI-RAN orkestratörü ile entegre edilmiştir. Harici AI çıkarım işlerini, aynı API’yi çalıştıran herhangi bir halk veya özel buluta bağlı bir AI-RAN sunucusuna aktarmak üzere tasarlanmıştır.
Bu çözüm, AI pazarı oluşturmayı mümkün kılarak SoftBank’ın yerel, düşük gecikme süreli ve güvenli çıkarım hizmetleri sunmasını sağlamaktadır. Ayrıca, harici YZ çıkarım işleri için telekom şirketlerinin YZ dağıtım ağı olmasına yardımcı olmanın önemini gösterdi ve yeni bir gelir fırsatı açtı.
AI-RAN Uygulamaları Sergilendi
Bu açık hava denemesinde, SoftBank tarafından geliştirilen yeni kenar YZ uygulamaları, canlı AI-RAN ağı üzerinden sergilendi:
- 5G üzerinden otonom araçların uzaktan desteklenmesi.
- Fabrika çok modlu YZ uygulamaları.
- Robotik uygulamalar.
5G Üzerinden Otonom Araçların Uzaktan Desteklenmesi
Otonom sürüşün sosyal olarak uygulanabilmesi için gereken temel gereksinimler; araç güvenliği ve işletme maliyetlerinin düşürülmesidir.
Fujisawa Şehri denemesinde, SoftBank bir otonom aracı, ön kamerasından aldığı videoyu 5G üzerinden YZ tabanlı uzaktan destek hizmetine aktarıyordu. Çok modlu YZ modelleri, video akışını analiz etti, risk değerlendirmesi yaptı ve önerilen eylemleri metin olarak otonom araçlara iletti.
Bu, açıklanabilir YZ örneği olarak değerlendirilmektedir; çünkü otonom aracın tüm eylemleri, özetlenmiş metin ve uzaktan destek için kayıtlar yoluyla izlenebilir ve açıklanabilir durumdadır.
Fabrika Çok Modlu YZ Uygulamaları
Bu kullanım durumunda, çok modlu girdiler; video, ses ve sensör verileri 5G üzerinden AI-RAN sunucusuna aktarılmaktadır. Birden fazla LLM, VLM, geri alma-yükseltilmiş üretim (RAG) kanalları ve AI-RAN sunucusunda barındırılan NVIDIA NIM mikroservisleri, bu girdileri birleştirmekte ve bilgilerin bir sohbet arayüzü aracılığıyla kullanıcılara erişilebilir olmasını sağlamaktadır.
Bu kullanım durumu, fabrika izleme, inşaat alanı denetimleri ve benzeri karmaşık iç mekan ve dış mekan ortamları için uygundur. Kullanım durumu, kenar YZ-RAN’ın yerel veri egemenliğini nasıl sağladığını gösterir. Bu, veri erişiminin ve analizinin yerelde, güvenli ve özel tutulmasını, çoğu işletmenin zorunlu bir gereksinimi olarak konumlandırmaktadır.
Robotik Uygulamaları
SoftBank, 5G ile bağlantılı bir robot için kenar YZ çıkarımının faydalarını göstermiştir. Bir robodog, ses ve hareket temelinde bir insanı takip etmek üzere eğitilmiştir.
Demo, robotun YZ çıkarımının yerel AI-RAN sunucusunda barındırıldığı ve merkezi bulutta barındırıldığı durumlarda yanıt sürelerini karşılaştırmıştır. Yerel kenar tabanlı çıkarım kullanan robodog, insanın hareketlerini anında takip ederken, bulut tabanlı çıkarım kullanan robot bu noktada zorluk yaşamıştır.
AI-RAN İş Modelinin Hızlandırılması
AI-RAN vizyonu endüstri tarafından benimsenmişken, GPU destekli altyapının enerji verimliliği ve ekonomisi, özellikle geleneksel CPU ve ASIC tabanlı RAN sistemleri ile karşılaştırmalar açısından anahtar gereksinimlerdir.
AI-RAN’ın bu canlı açık hava denemesi, SoftBank ve NVIDIA’nın GPU destekli RAN sistemlerinin uygulanabilir ve yüksek performanslı olduğunu kanıtlamakla kalmayıp, aynı zamanda enerji verimliliği ve ekonomik karlılık açısından önemli üstünlükler sunarak geçerliliğini de kanıtlamıştır.
NVIDIA, bir sonraki nesil NVIDIA Grace Blackwell süper çipleri üzerine kurulu Aerial RAN Computer-1’i AI-RAN dağıtım platformu olarak önermiştir. Amacı, SoftBank 5G vRAN yazılımını NVIDIA GH200’den NVIDIA Aerial RAN Computer-1’e taşımaktır; bu değişim, kodun zaten CUDA uyumlu olması nedeniyle daha kolay hale gelecektir.
GB200-NVL2 ile birlikte, AI-RAN için sağlanan hesaplama kapasitesi iki katına çıkacaktır. AI işleme yetenekleri ise, Llama-3 çıkarımı için 5 kat, veri işleme için 18 kat ve vektör veri tabanı araması için 9 kat artış gösterecektir.
Bu değerlendirme için, Aerial RAN Computer-1 tabanlı hedef dağıtım platformunu, en son x86 nesli ve en iyi özel RAN ürün kıyaslamaları ile karşılaştırmış ve aşağıdaki bulguları doğrulamıştır:
- Hızlandırılmış AI-RAN, sınıfının en iyisi YZ performansı sunuyor.
- Hızlandırılmış AI-RAN, sürdürülebilir bir RAN’tır.
- Hızlandırılmış AI-RAN yüksek düzeyde kârlıdır.
Hızlandırılmış AI-RAN Sınıfının En İyisi YZ Performansı Sunuyor
100% YZ modunda her GB200-NVL2 sunucusu, 25.000 token/saniye üretmektedir; bu da sunucu başına saatlik 20 $ değerinde monetizasyon edilebilir bir hesaplama anlamına gelmektedir ve bunun aylık karşılığı 15.000 $’dır.
Mobil hizmetlerin ortalama kullanıcı başına geliri (ARPU) ülkeden ülkeye değişiklik göstererek 5–50 $/ay arasında olup, AI-RAN, RAN sadece sistemlerden elde edilen gelirlerle karşılaştırıldığında çok daha yüksek bir potansiyel sunmaktadır.
Kullanılan token YZ iş yükü Llama-3-70B FP4 modelidir; bu da AI-RAN’ın dünyanın en gelişmiş LLM modellerini çalıştırma kabiliyetine sahip olduğunu göstermektedir.
Hızlandırılmış AI-RAN Sürdürülebilir RAN’dır
100% RAN sadece modda, GB200-NVL2 sunucusunun güç performansı Watt/Gbps cinsinden aşağıdaki gibi gösterilmektedir:
- Mevcut en iyi özel RAN sistemlerine göre %40 daha az enerji tüketimi.
- x86 tabanlı vRAN’a göre %60 daha az enerji tüketimi.
- Dağıtılmış RAN ve merkezi RAN konfigürasyonları arasında benzer verimlilikler.
Bu türden bir karşılaştırmada, tüm platformlar için aynı sayıda 100-MHz 4T4R hücre ve %100 RAN ayrıcalığı göz önünde bulundurulmaktadır.
Hızlandırılmış AI-RAN Yüksek Düzeyde Karlıdır
Bu değerlendirmede, Tokyo’da bir bölgenin 600 hücreyle kapsanması senaryosunu temel alarak, her üç platform için RAN dağıtımı için ortak bir temel oluşturdum. Sonrasında, RAN ve YZ iş yükü dağıtımını, yalnızca RAN’dan YZ ağırına kadar birçok senaryo üzerinden analiz ettik.
YZ ağırlıklı senaryoda, bir üçüncü RAN ve iki üçüncü YZ iş yükü dağılımı kullanıldı:
- Hızlandırılmış AI-RAN altyapısına yapılan her dolar KapEx yatırımında, telekom şirketlerinin 5 yıl içerisinde 5 kat gelir elde etmesi mümkündür.
- Net kâr açısından, toplam yatırım %219 kâr marjı sağlamaktadır; bu, tüm KapEx ve OpEx maliyetleri göz önüne alınarak hesaplanmıştır. Bu tabi ki SoftBank için geçerlidir; zira yerel ülke maliyet varsayımları kullanılmıştır.
33% YZ ve 67% RAN | 67% YZ ve 33% RAN | |
KapEx başına gelir (dolar) | 2x | 5x |
Kar marjı % (TCO’ya göre) | 33% | 219% |
RAN ağırlıklı senaryoda ise, iki üçüncü RAN ve bir üçüncü YZ iş yükü dağılımı kullanılarak karşılaştırma yapılmıştır. Bu durumda, NVIDIA destekli AI-RAN için KapEx başına gelir oranı 2 kat, %33 kâr marjı sunmuştur.
RAN sadece senaryosunda, NVIDIA Aerial RAN Computer-1, özel RAN çözümlerine göre daha maliyet etkindir ki bu durum, radyo sinyal işleme için hızlandırılmış bilişimin faydalarını gözler önüne sermektedir.
Bu senaryolardan, hem YZ ağırlıklı hem de RAN ağırlıklı modlarda AI-RAN’ın RAN’dan daha yüksek kârlılığa sahip olduğu açığa çıkmıştır. Kısacası, AI-RAN, geleneksel RAN’ı maliyet merkezlerinden kâr merkezlerine dönüştürmektedir.
Sunucu başına kârlılık, yüksek YZ kullanımı ile artmaktadır. Hatta RAN sadece durumlarında bile, AI-RAN altyapısı, özel RAN yalnızca çözümlerine göre daha maliyet etkindir.
Kazanç, toplam sahip olma maliyeti (TCO) hesaplamaları için kullanılan ana varsayımlar; her platform için hizmet sunan sunucu ve raf sayılarının, 600 hücrelik dağıtımda aynı frekansta ve 4T4R ile hesaplandığıdır.
- Toplam sahip olma maliyeti (TCO), 5 yıl boyunca donanım, yazılım ve vRAN ve YZ işletim maliyetleri dahil olmak üzere hesaplanmış olup, yeni YZ gelir hesaplaması, GB200 NVL2 YZ performansına dayalı olarak sunucu başına saatlik 20 $ kullanılarak yapılmıştır.
- OpEx maliyetleri yerel Japonya enerji maliyetlerine dayanmaktadır ve bu durum dünya genelinde genellenebilir değildir.
- Kâr marjı % = (yeni YZ gelirleri – TCO) / TCO
Bunlar doğrultusunda YZ gelir potansiyeli, enerji verimliliği ve AI-RAN’ın kârlılığı, teknolojinin uygulanabilirliği, performansı ve ekonomik faydaları konusunda hiç şüphe bırakmamaktadır.
Gelecek dönemde, NVIDIA’nın Vera Rubin gibi her yeni süper çip nesli, bu faydaları katlayarak artıracak ve telekom ağlarının beklenen iş dönüşümünü olanaklı kılacaktır.
Geleceğe Bakış
SoftBank ve NVIDIA, AI-RAN’ın ticarileşmesini hızlandırmak ve yeni uygulamalar geliştirmek üzere iş birliğine devam etmektedir. İlerleyen süreçte; spektral verimliliği artırmak için RAN’a YZ uygulamalarının uygulanması ve fiziksel ağları dijital dünyada simüle etmek için NVIDIA Aerial Omniverse dijital ikizleri üzerinde çalışmalar yapılacaktır.
NVIDIA AI Aerial, operatörlerin ve ekosistem ortaklarının hızlı 5G ve 6G ağlarını dönüştürmek için hızlandırılmış bilişim ile yazılıma dayalı RAN ve YZ güçlerinden faydalanmasını sağlıyor. Artık NVIDIA Aerial RAN Computer-1 ve AI Aerial yazılım kütüphanelerini kullanarak kendi AI-RAN uygulamanızı geliştirebilirsiniz.
NVIDIA AI Enterprise, aynı zamanda AI-RAN üzerinde barındırılabilecek yeni YZ uygulamaları oluşturmaya yardımcı olur; bu, denemede kullanılan birçok NVIDIA yazılım aracıyla ortaya çıkmaktadır. Bu; nesil YZ için NVIDIA Isaac, NVIDIA NeMo, RAPIDS, NVIDIA Triton çıkarım ve AI aracı API’lerini içermektedir.
Telekom endüstrisi, AI hizmet sağlayıcısı olma yolunda büyük bir fırsatın eşiğindedir. AI-RAN; hızlandırılmış bilişimi yeni bir temel olarak kullanarak dünya çapında telekom şirketlerinin yeniden doğuşunu başlatabilir.
Bu duyuru, AI-RAN teknolojisinde bir dönüm noktasıdır; uygulanabilirliğini, taşıyıcı sınıfı performansını, üstün enerji verimliliğini ve ekonomik değerini kanıtlamıştır. NVIDIA destekli AI-RAN altyapısına yapılan her dolar yatırımı, 5 kat gelir getirirken, 6G’ye hazır olup, YZ gelirinin artışı için bu yolculuğa hemen başlayabilirsiniz.