NVIDIA Generative AI ile TCS, Otomotiv Yazılım Test Hızını 2 Kat artırdı

Üretken yapay zeka, otomotiv endüstrisinin her alanını dönüştürüyor; bu yazılım geliştirme, test etme, kullanıcı deneyimi, kişiselleştirme ve güvenlik dahil. Otomotiv endüstrisi, mekanik bir yaklaşımdan yazılım odaklı bir yaklaşım içine kayarken, üretken yapay zeka yeni olanaklar sunuyor.

Tata Danışmanlık Hizmetleri (TCS), otomotivde üretken yapay zekayı kullanmak için iki ana alana odaklanıyor:

Müşteri deneyimini geliştiren özellikler üretmek
Yazılım mühendislik yaşam döngüsünü hızlandırmak

Müşteri Deneyimini Geliştirme

Üretken yapay zeka, tam otonom araçların (AV’ler) gerçekleştirilmesinde önemli bir rol oynuyor ve bu sayede AI tabanlı algoritmaların daha iyi karar verme yetenekleri geliştirilmesine olanak tanıyor. Farklı olasılıklar doğrultusunda veri kümeleri üreterek bunları sentezliyor, sınırlı gerçek zamanlı veriden eğitim ve test verilerine kadar geniş bir yelpazede hizmet sunuyor. Bu teknoloji, araç kişiselleştirmesi ve kullanıcı deneyimi sunmada kritik bir rol oynuyor. Gelişmiş arama işlevsellikleri, dil çevirileri, araç içi kişisel asistanlar ve video-audio eğlence için sezgisel öneriler gibi çeşitli yetenekleri kapsıyor.

Yazılım Mühendislik Yaşam Döngüsünü Hızlandırma

Yazılım tanımlı araçların (SDV) amacı, daha fazla esneklik sağlayarak kullanıcı deneyimini zenginleştirmek ve müşterilerin araç özelliklerini kendi konforlarına göre güncelleyip değiştirebilmelerine olanak tanımaktır. Bu durum, araç karmaşıklığını artırmış ve milyonlarca satır kod yazılmasına neden olmuştur. Özellik-hizmet modellerinin uygulanması için acil bir talep var ve otomotiv özelliklerinin birkaç hafta içinde geliştirilmesi ve dağıtılması gerekiyor.

Mevcut süreçler ve araçlar, bu süre zarfında istenilen hedefe ulaşmayı neredeyse imkansız kılıyor. Burada üretken yapay zeka, mühendislerin “yan arkadaşı” olarak yazılım mühendislik yaşam döngüsünü hızlandırma potansiyeline sahiptir; bu, gereksinim analizi, tasarım, geliştirme ve doğrulamayı kapsar.

Bu temel alanlarla TCS, NVIDIA teknolojileri ile geliştirilmiş TCS patentli algoritmaları kullanarak Otomotiv Gen-AI Suite adlı bir platform oluşturdu. Şekil 1, metin tabanlı kullanım senaryoları için dış ortamda bir mimariyi göstermektedir. Büyük dil modelleri (LLM), NVIDIA NeMo çerçevesi ile eğitilmiş ve otomotiv alanına özgü veri setleri kullanılarak NVIDIA NIM mikro hizmetleri ile ince ayar yapılmıştır, bunlar da NVIDIA AI Enterprise yazılım platformunun bir parçasıdır.

Bu yazı, bir kullanım senaryosunu, birim düzeyinde test senaryolarının oluşturulmasını, yaklaşımı ve başarıyı ölçmek için kullanılan temel performans göstergelerini (KPI’lar) incelemektedir.

TCS Automotive Gen-AI solution architecture, including application services, APIs, framework, and training toolkit. — *Şekil 1. TCS Otomotiv Gen-AI çözüm mimarisinin NVIDIA teknolojilerini kullandığını göstermektedir.*

Test Senaryosu Oluşturma

Otomotiv alanındaki yapılandırılmamış sistem gereksinimlerinden test senaryoları oluşturmak, yazılım mühendislik yaşam döngüsündeki en zaman alıcı adımlardan biridir.

Image showing the source text (system requirement) and target text (various test cases for the system requirements) for test case generation. — *Şekil 2. Kaynak metin ve test senaryoları için hedef metinler.*

Mevcut sistemlerde otomotiv alanındaki çeşitli test senaryosu havuzlarının oluşturulması çoğunlukla elle yapılmakta, bu da zaman ve maliyet açısından oldukça yükleyici olmaktadır. Bu test senaryolarının eğitimi ve geliştirilmesi haftalar alabilmektedir.

TCS, NVIDIA teknolojilerini kullanarak yapılandırılmamış metin tabanlı gereksinimlerden test senaryolarını otomatik olarak oluşturmayı amaçlamaktadır.

LLM’ler, süreci hızlandırmakta ve maliyeti minimum müdahale ile azaltmaktadır. Senaryolar ve bunlara karşılık gelen test senaryoları oluşturulmakta ve bu senaryolar daha sonra uzmanlar tarafından doğruluğu ve kapsamı açısından doğrulanmaktadır. TCS, LLM çıktısını analiz ederek ve daha düşük doğruluk veya kapsamı olan verileri seçerek veri kümesini dikkatlice hazırlamaktadır. Bu süreçte kullanılarak, NVIDIA NeMo çerçevesinde otomotive özgü veriler üzerinde PEFT teknikleri (Düşük Sıra Adaptasyonu – LoRA) kullanılarak modelin ince ayarı yapılmaktadır. Ayrıca, en uygun KPI’ları optimize etmek için prompt seçiminde önemlidir.

Dağıtım için TCS, NVIDIA DGX H100 sistemlerinde NVIDIA NIM mikro hizmetlerini kullanmaktadır. Önceden işlenmiş giriş, otomotiv bilgisi ile eğitim görmüş NeMo tabanlı ince ayarlı bir modele beslenmektedir. Instruct modeli olarak kullanılan temel model Llama 3 8B’dir. Son işlemlerden sonra çıkan sonuç, müşterilerin yeteneklerini artırmalarına yardımcı olacak test senaryolarıdır.

Şekil 3, giriş gereksinimlerinden çıkan test senaryolarını gösterir. Giriş, birkaç örnekleme ve kabuk zinciri gibi tekniklerle işlenir. Her bir kullanım senaryosu için bağlam bilgisi, işleme adımlarında müşterinin referans belgelerinden yararlanılarak sağlanır ve retrieval-augmented generation (RAG) teknikleri kullanılır.

Diagram showing the test case generation from requirements, including input requirements, output test cases, preprocessing, postprocessing, and training pipeline. — *Şekil 3. Gereksinimlerden test senaryosu oluşturma yaklaşımı.*

Modelin eğitilmesi için, alan ve göreve özgü hazırlanmış veri blokları kullanılmakta ve temizleme işleminin ardından ince ayar bloğuna beslenmektedir. Bu blok, LoRA ile PEFT kullanılarak çalıştırılmaktadır ve NVIDIA NeMo çerçevesinde (NeMo: 24.05 konteyner) bir fusion Adam optimizasyonu uygulanmaktadır. Modelin aşırı uydurulmasını önlemek için 1 ila 100 adım arasında bir eğitim süreci uygulanmaktadır. TCS, ince ayarlı modeli, NVIDIA NIM (Meta/Llama3-8b-instruct: 1.0.0) konteyneri aracılığıyla dağıtmaktadır. Oluşan çıktı daha sonra post-processing ile LangChain ile birleştirilerek gereken test senaryosu çıktıları üretilmektedir.

NVIDIA AI Enterprise Yazılım Platformu ile Optimizasyon

TCS, NVIDIA NeMo’yu bu gelişmiş modelleri oluşturmak için kullanmaktadır. Temel LLM’ler, otomotive özgü veri setleri ile LoRA tekniği kullanılarak ince ayar yapılmıştır. İnce ayar, GPU kullanımını artırmak için NeMo çerçevesi eğitim konteynerinde gerçekleştirilmiştir.

NVIDIA NIM tabanlı optimizasyon kullanarak TCS, NVIDIA DGX sistemlerinde düşük gecikme (neredeyse gerçek zamanlı) ve yüksek verimlilik elde etmiştir. NIM mikro hizmetleri kullanarak gerçekleştirilen son işlem kuantizasyonu, GPU kullanımını ve gecikmeyi düşürmektedir. NIM aynı zamanda uygulama hizmetlerinden doğrudan çağrılabilecek inferans API’leri sunmaktadır.

En İyi Modeli Belirlemek için Benchmarklar

TCS test senaryosu oluşturma sürecinin farklı LLM’lerin GPU kullanımı, eğitim parametreleri ve çıktı doğrulukları açısından bir karşılaştırma çalışması gerçekleştirilmiştir.

Giriş olarak bir spesifikasyon dokümanı veya bu spesifikasyonlara dayalı bir prompt kullanılmaktadır.
Bu girdiler, otomotive özgü veriler ile ince ayar yapılmış LLM NIM mikro hizmetlerine beslenmektedir.
Üretilen çıktı, hatalı ve tekrar eden test senaryoları açısından doğrulanmaktadır. Gerekirse, yeni bir prompt ile düzeltmeler yapılmakta veya daha fazla test senaryosu oluşturulmaktadır ve süreç tekrar edilmektedir.
Doğruluk ve kapsam, karşılaştırma için kullanılmaktadır.
NIM tabanlı inferans, benzer doğruluklara sahip diğer açık kaynaklı doğrudan inferans senaryolarına göre ortalama %2,5 ila %3 daha hızlıdır.

Şekil 4, kullanıcıların belirli bir kullanım durumu için en uygun modeli belirlemelerine ve gereksinimler için en uygun temel modeli seçmelerine yardımcı olmak üzere önceden eğitilmiş modellerin karşılaştırmasını göstermektedir. Bu karşılaştırma, yalnızca doğruluk ve test senaryosu sayısını değil, aynı zamanda karar kapsamı, durum kapsamı ve Değiştirilmiş Durum Karar Kapsamı (MCDC) gibi kriterleri de içermektedir.

Bar chart comparing pretrained models for interaction and average number of test cases. Models include Llama 2 70B, Code Llama 13B, Mistral 8x7B, Nemotrol 3 8B, and Llama 3 8B Instruct NIM. — *Şekil 4. Doğruluk ve test senaryosu sayısı açısından önceden eğitilmiş modellerin karşılaştırması*

*Test senaryosu gereksinimlerini dikkate almaktadır.

Karar Kapsamı

Karar kapsamı, bir modeldeki karar noktalarını, örneğin switch blokları veya akış durumlarını değerlendirmektedir. Modelin test edilmesi sırasında tüm olası yolların en az bir kez travers edilmesi ile tam kapsam sağlanmaktadır.

Durum Kapsamı

Durum kapsamı, girişlerin ve durum akış geçişlerinin mantıksal kombinasyonlarını incelemektedir. Tam kapsam, modeldeki her girişin ve geçiş koşulunun en az bir kez gerçek ve yanlış olarak test edilmesi ile elde edilmektedir.

MCDC

MCDC, bir modeldeki mantıksal girişlerin ve geçiş koşullarının bağımsızlığını değerlendirmektedir. Tam kapsam, bir girişte ya da koşulda yapılan bir değişikliğin, diğerlerinden bağımsız olarak, model çıktısını değiştirmesi ya da bir geçişi tetiklemesi halinde sağlanmaktadır.

Tablo 1, neden bu durumda Llama 3 8B Instruct modelinin, doğruluk, karar ve MCDC kriterlerinde üstün performans gösterdiğini açıklamaktadır. Online model inferansı ve ince ayar süreçleri, müşteri verilerinin hassasiyeti nedeniyle kapsam dışında kalmıştır; tüm eğitim ve inferans TCS’nin kendi bünyesindeki NVIDIA DGX H100 sistemlerde çevrimdışı modda gerçekleştirilmiştir.

Llama 3 8B Instruct’ı Temel Alan Modeli Olarak Karşılaştırma
Model	Doğruluk	Karar	Durum	MCDC
Llama 3 8B Instruct NVIDIA NIM önceden eğitilmiş	87%	84.5%	88.56%	71.22%
Llama 3 8B Instruct NVIDIA NIM ince ayar yapılmış	91%	85.1%	87.89%	73.11%

Tablo 1. Önceden eğitilmiş ve ince ayar yapılmış Llama 3 8B Instruct modelinin karşılaştırması

*Test senaryosu gereksinimlerini dikkate almaktadır.

Büyük dil modellerinin (LLM’ler) kullanımı, otomotiv yazılımının eğitim ve geliştirilmesi için maliyet ve zamanı azaltabilir. LLM’ler, temel gereksinimleri anlamada ve otomatik test senaryoları yazmada insan müdahalesini en aza indirmektedir. Ayrıca, senaryo ve test senaryoları oluşturma da yapılmakta ve bunlar daha sonrasında uzmanlar tarafından doğruluk ve kapsama açısından değerlendirilmektedir.

Sonuç

Üretken yapay zeka ve otomotiv alanındaki uzmanlığı ile TCS, NVIDIA DGX H100 sistemleri ve NVIDIA NIM ile NVIDIA NeMo yazılımı kullanarak son derece verimli bir otomotiv test senaryosu oluşturma hattı geliştirmiştir. Bu model, NVIDIA NeMo çerçevesi ile ince ayar yapıldığında, mevcut modellere kıyasla daha yüksek doğruluk ve kapsam sunmaktadır. TCS, genel test senaryosu oluşturma hattında ~%2 hızlanma gözlemlemiştir.

TCS, ayrıca NeMo ve NIM’i, konuşma tabanlı LLM’leri, bağlam anlayışı için görsel LLM’leri ve görüntü tabanlı üretken advers ağ modellerini (GAN) geliştirmek amacıyla kullanmaktadır. TCS, NVIDIA Blueprints kullanarak çok modlu yetenekler keşfetmeye ve yazılım mühendislik yaşam döngüsünü daha da geliştirmeye devam edecektir.