Yapay zeka, bilim insanlarının tamamen yeni materyaller tasarlamalarına yardımcı olan ve mühendislerin bu tasarımları üretim planlarına dönüştürdükleri bir gelecek yaratmada önemli bir rol oynamaktadır. Daha önce ulaşılması güç bir vizyon olan bu gelişim, AI’nın inovasyon sınırlarını yeniden tanımlamasıyla birlikte artık daha yakın görünmektedir.
Bu paradigma değişimini tanıyarak, yapay zeka, kimya ve malzeme bilimi alanlarında bir uzmanlık birleşimi ortaya çıkmaktadır. AI uzmanları, kimyagerler ve malzeme bilimcileri arasındaki bu disiplinlerarası iş birliği, geleneksel ve zor olan deneme-yanılma yöntemlerini aşmayı hedeflemektedir.
Birlikte, tasarım ile üretim döngüsünü on yıllardan aylara kısaltmak için AI modelleri ve veri setleri oluşturuyorlar. Bu sayede, verimli bataryalardan biyolojik olarak parçalanabilen polimerlere kadar yeni nesil yeniliklerin önünü açmayı amaçlıyorlar.
Bu yazıda, kimyasal ve malzeme keşfini hızlandırmayı hedefleyen NVIDIA ALCHEMI (Kimya ve Malzeme İnovasyonu için AI Laboratuvarı) tanıtılmaktadır.
Yapay Zeka ile Hızlandırılan Kimyasal ve Malzeme Keşif Süreci
Yeni bir malzemenin keşfi, genel olarak dört aşamaya ayrılabilir:
- Hipotez Oluşturma
- Çözüm Alanını Tanımlama
- Özellik Tahmini
- Deneysel Doğrulama
Hipotez Oluşturma
- İçgörü Sentezi: Kimya literatürü ile eğitilmiş büyük dil modellerinden (LLM’ler) yararlanarak büyük bir kimyasal literatür derlemesi oluşturmak.
- Hipotez Formülasyonu: Kimya ile bilgilendirilmiş LLM’leri düşünce ortağı olarak kullanarak hipotezleri geliştirmek ve rafine etmek.
Çözüm Alanını Tanımlama
- Geniş Veri Tabanı Arama: Mevcut kimyasal veritabanlarından ilgi alanını belirlemek.
- Hedef Yapı Üretimi: İstenen özelliklere göre yeni adaylar önermek için üretken AI kullanmak.
Özellik Tahmini
- Moleküler Temsili Öğrenme: Çözüm alanındaki adayların özelliklerini tahmin etmek için öğrenilmiş moleküler temsilleri kullanmak.
- Atomistik Simülasyon: Yüksek düzeyde özellik tahmini yapmak için AI temelli yaklaşımlar (MLIPs, GNN’ler) uygulamak.
- Densite Fonksiyonel Teorisi (DFT) Doğrulaması: Tahmin edilen özellikleri DFT simülasyonları ile doğrulamak.
Deneysel Doğrulama
- Aday Önerisi: Kimyasal bilgiyi keşfetmek ve doğrulanmış özellikler doğrultusunda laboratuvar için adaylar önermek.
- Deneyim Otomasyonu: AI destekli öz sürüşlü laboratuvar ve aktif öğrenme ile laboratuvar sentezini ve testlerini hızlandırmak.
Kimyada ve Malzeme Biliminde Ar-Ge’yi Hızlandırmak
NVIDIA ALCHEMI, kimya ve malzeme bilimi konusundaki Ar-Ge süreçlerini AI’nın gücü ile hızlandırmayı hedeflemektedir. ALCHEMI, geliştiriciler ve araştırmacılar için NVIDIA NIM-hızlandırma mikro servisleri ve API’ler içerecektir.
- Yeni potansiyel adaylar öneren üretken AI modellerinin oluşturulması ve devreye alınması.
- Geleneksel ab initio simülasyon yöntemlerine göre doğruluk ve hesaplama maliyeti arasında bir denge sağlayan AI vekil modellerinin geliştirilmesi ve kullanılması.
- Hızlı tarama için malzeme temsilini özelliklere eşlemek üzere erişilebilir kimyasal ve malzeme bilimi bilgisi araçları ve önceden eğitilmiş temell modeler.
- Yeni kullanım durumları için AI modellerini eğitmek ve ince ayar yapmak amacıyla sentetik veri seti oluşturma simülasyon araçları.
NVIDIA ALCHEMI, belirli bir AI vekil modelleme uygulamasını hızlandırmayı hedefleyen ilk hızlandırılmış malzeme keşif NIM’ini tanıtıyor; bu model, makine öğrenimi arasında atomik potansiyeller (MLIPs) sınıfına odaklanmaktadır.
Makinel Learning Interatomic Potentials
Bazı geleneksel hesaplama yöntemleri, hassasiyet ve hesaplama maliyeti açısından çeşitli özellikler taşımaktadır. Daha yüksek bir hassasiyet sunan bir yöntem, hesaplama açısından oldukça yüksek maliyetler doğurur. Örneğin, DFT hesaplamaları 10 atomluk bir sistem için birkaç dakika sürerken, 100 atom için saatler alıyor. Ancak 1,000’den fazla atom içeren bir sistemde, DFT (atom sayısıyla birlikte kübik olarak ölçeklendiği için) haftalar sürebiliyor ve bu durum büyük karmaşık sistemler için pratik olmayabiliyor.
MLIPs, hassasiyet ve hesaplama maliyetini dengelemek için AI’nın gücünü kullanarak atomik yapıların potansiyel enerji ve atomik kuvvetlere olan haritalanmasını sağlamaktadır. MLIPs genellikle, atomları düğüm ve aralarındaki mesafeleri kenar olarak temsil eden GNN’ler kullanarak atomik yapıları graf olarak temsil eder. Bu şekilde, bir molekülü veya malzemeyi oluşturan atomlar arasındaki uzamsal ilişkilere kolaylıkla erişebilirler.
MLIPs, kimya, malzeme bilimi ve biyolojide geniş uygulama alanlarına sahiptir. Bu, fizik-bilgilendirilmiş sinir ağları (PINNs) ile karşılaştırıldığında geniş kapsamlıdır; çünkü PINNs, esas olarak hesaplamalı akışkanlar dinamiği ile ilgili fiziksel denklemleri entegre ederler.
Geometri Rahatlatma
Kimyasal ve malzeme keşif süreçlerinde önemli bir adım, stabil malzemeleri kararsız olanlardan ayırmak için geometri rahatlatmadır. Bu, üretken modellerle ilgili süreçlerde oldukça kritik bir aşamadır. Bir malzemenin enerjisi, her atom üzerindeki kuvvetleri değerlendirerek ve atom konumlarını potansiyel enerji çukurunun dibine doğru ayarlayarak minimize edilir. Her bir malzeme adayı, bu enerji minimumuna ulaşmak için binlerce rahatlatma adımı gerektirebilir.
NVIDIA Toplu Geometri Rahatlatma NIM
MLIPs, geometri rahatlatma hesaplamalarını önemli ölçüde hızlandırırken, uygulama hâlâ zaman alıcı olabiliyor. Bu nedenle, NVIDIA, potansiyel batarya malzemelerinin geometri rahatlatma hesaplamalarını hızlandırmayı amaçlayan NVIDIA Toplu Geometri Rahatlatma NIM’ini geliştirmiştir. Bu NIM, yalnızca bir API’yi açığa çıkaran bir konteynırdır. Geleneksel CPU tabanlı simülasyon yükleri, MLIPs’in tam performansını kullanmakta eksikte kalmakta ve CPU-GPU veri hareketinde önemli iletişim yüklerine neden olmaktadır.
Yuvarlak hesaplamalar için NVIDIA Warp ile birlikte kullanılabilen bir Python geliştirici çerçevesi sunarak, belirli bir zaman süresi içinde yapılacak birden fazla geometri rahatlatma simülasyonu başlatabilmekte ve mevcut GPU kaynaklarının kullanımını en üst düzeye çıkarmaktadır. Bu, her adayın binlerce rahatlatma adımı gerektirdiği ve ciddi hız kazanımı sağlandığı kritik bir süreçtir.
Yapılan testlerde 2,048 küçük ve orta boy inorganik kristal sistemi kullanılarak, NVIDIA H100 80 GB GPU’da MACE-MP-0 modeli ile ciddi hız kazançları sağlanmıştır. Geleneksel yöntemlerle bu sistemlerin hesaplanması 15 dakika sürerken, NIM ile birlikte bu süre 36 saniyeye düşmüştür; bu da %25 hız kazanımını ifade etmektedir. Toplu boyutun 1’den 128’e çıkarılması ise toplam süreyi 9 saniyeye düşürerek %100 hız kazancı sağlanmıştır.
Toplu Geometri Rahatlatma NIM | Toplu boyut | Toplam zaman (s) | Sistem başına ortalama zaman (s/sistem) | Yaklaşık hız kazanımı |
Kapalı | 1 | 874 | 0.427 | 1x |
Açık | 1 | 36 | 0.018 | 25x |
Açık | 128 | 9 | 0.004 | 100x |
81 851 küçük ve orta boy organik molekül üzerinde yapılan karşılaştırmalı testte, AIMNet2 ve ASE FIRE kullanılarak NIM açık olduğunda %60 hız kazanımı elde edilmiştir. Toplu boyutun 1’den 64’e çıkarılması ile birlikte ise %800’e kadar hız kazanımları sağlanmıştır. Bu haftalarca süren simülasyonları saatlere, saatleri dakikalara indirerek yenilikçi süreçler sunmaktadır.
SES AI, lityum-metal bataryaların lider geliştiricilerinden biri olarak NVIDIA ALCHEMI NIM mikro servisini kullanarak elektrikli araçlar için elektrolit malzemelerinin belirlenmesini hızlandırmayı hedeflemektedir. SES AI’nın CEO’su Qichao Hu, “Yapay zeka destekli malzeme keşfi ile lityum batarya teknolojisini ilerletmeyi taahhüt ediyoruz. ALCHEMI ile keşif sürecimizi köklü bir şekilde hızlandırmayı planlıyoruz,” demektedir.
NVIDIA Toplu Geometri Rahatlatma NIM ile Başlamak
NVIDIA Toplu Geometri Rahatlatma NIM ile başlamak için gerekenler şunlardır:
- Python ve ASE ile çalışma bilgisi
- Bir Docker konteynırının çalıştırılmasına dair bilgi
- MACE-MP-0 (malzemeler) veya AIMNet2 (moleküller) modeline ihtiyaç
Prosedür
NVIDIA NIM, bir API’yi açığa çıkaran bir konteynırdır ve NIM ile etkileşim iki ana adımda gerçekleşir:
İlk olarak, konteynırın başlatılması gerekir:
docker run --rm -it --gpus all
-p 8003:8003
<NIM konteyner adresi>
Ayrıca, --gpus all
ile NIM’in hangi cihazlarda yükleyeceği ayrı model ve optimize edici örneklerini belirlemekteyiz. Eğer birden fazla cihaz varsa, NIM, mümkün olan model örnekleri arasında talepleri dağıtacaktır. İkincisi, yerel portu 8003’e açarak, NIM API’sinin varsayılan iletişim portuna yönlendirme yapılmasını sağlıyoruz.
Konteynır başlatıldıktan sonra isteklerinizi göndermeye başlayabilirsiniz:
import os, requests, json
import numpy as np
from ase import Atoms
from ase.io.jsonio import MyEncoder, decode
atoms: list[Atoms] = # Buraya ase.Atoms girişi ekleyin
# NIM URL'sini tanımlayın
url: str = 'http://localhost:8003/v1/infer'
# Giriş atomlarını json'da hazırlayın
data = {"atoms": json.dumps(atoms, cls = MyEncoder)}
headers = {'Content-Type': "application/json"}
# NIM'e istek gönderin
response = requests.post(url, headers = headers, json=data)
response.raise_for_status()
# json çıktısını ase.Atoms'a dönüştürün
optimized_atoms = decode(response.json())
Dikkat Edilmesi Gerekenler
- Ase, popüler bir moleküler modelleme Python paketidir ve giriş verileri
ase.Atoms
biçiminde ifade edilmektedir. - Kullanıcı, NIM’in
http://localhost:8003/v1/infer
bağlantısını sağlamalıdır. - Kullanıcı,
ase.Atoms
‘u .json string’ine dönüştürmeli verequests
kütüphanesini kullanarak istek göndermelidir.
Sonuç
NVIDIA Toplu Geometri Rahatlatma NIM’sinin kullanımı, MLIP hesaplamalarını %800 oranında hızlandırmıştır. Bu hızlı geliştirme, milyonlarca adayın yüksek verimli simülasyonlarını mümkün kılmakta ve yüksek kaliteli verilerle eğitilen yeni nesil temell modelleri için kapılar açmaktadır. Bu, NVIDIA ALCHEMI ile kimyasal ve malzeme keşif süreçlerini sonuna kadar hızlandırarak, daha sürdürülebilir ve sağlıklı bir geleceğin bulunmasına katkıda bulunmaktadır.
NVIDIA Toplu Geometri Rahatlatma NIM‘in indirilmesi için bildirim almak üzere kayıt olun.