NVIDIA ALCHEMI ile AI Destekli Malzeme Keşfini Devrim Niteliğinde Yeniden Şekillendirmek

Yapay zeka, bilim insanlarının tamamen yeni materyaller tasarlamalarına yardımcı olan ve mühendislerin bu tasarımları üretim planlarına dönüştürdükleri bir gelecek yaratmada önemli bir rol oynamaktadır. Daha önce ulaşılması güç bir vizyon olan bu gelişim, AI’nın inovasyon sınırlarını yeniden tanımlamasıyla birlikte artık daha yakın görünmektedir.

Bu paradigma değişimini tanıyarak, yapay zeka, kimya ve malzeme bilimi alanlarında bir uzmanlık birleşimi ortaya çıkmaktadır. AI uzmanları, kimyagerler ve malzeme bilimcileri arasındaki bu disiplinlerarası iş birliği, geleneksel ve zor olan deneme-yanılma yöntemlerini aşmayı hedeflemektedir.

Birlikte, tasarım ile üretim döngüsünü on yıllardan aylara kısaltmak için AI modelleri ve veri setleri oluşturuyorlar. Bu sayede, verimli bataryalardan biyolojik olarak parçalanabilen polimerlere kadar yeni nesil yeniliklerin önünü açmayı amaçlıyorlar.

Bu yazıda, kimyasal ve malzeme keşfini hızlandırmayı hedefleyen NVIDIA ALCHEMI (Kimya ve Malzeme İnovasyonu için AI Laboratuvarı) tanıtılmaktadır.

Yapay Zeka ile Hızlandırılan Kimyasal ve Malzeme Keşif Süreci

Yeni bir malzemenin keşfi, genel olarak dört aşamaya ayrılabilir:

Hipotez Oluşturma
Çözüm Alanını Tanımlama
Özellik Tahmini
Deneysel Doğrulama

The AI-driven workflow for chemical and material discovery consists of four key steps. It starts with hypothesis generation which is informed by insights from chemical literature and various open and proprietary datasets. The second step is solution space definition where researchers can search for potential candidates from large chemical databases or generate new-to-science ones with generative AI. The third step involves property prediction of candidates in the solution space via molecular representation learning or atomistic simulation, and property validation with density functional theory. The last step is experimental validation which involves recommending candidates for lab synthesis and testing based on predicted/validated properties. The best-performing candidate from lab testing is then selected for large-scale manufacturing. — *Şekil 1. AI ile hızlandırılan kimyasal ve malzeme keşif aşamaları*

Hipotez Oluşturma

İçgörü Sentezi: Kimya literatürü ile eğitilmiş büyük dil modellerinden (LLM’ler) yararlanarak büyük bir kimyasal literatür derlemesi oluşturmak.
Hipotez Formülasyonu: Kimya ile bilgilendirilmiş LLM’leri düşünce ortağı olarak kullanarak hipotezleri geliştirmek ve rafine etmek.

Çözüm Alanını Tanımlama

Geniş Veri Tabanı Arama: Mevcut kimyasal veritabanlarından ilgi alanını belirlemek.
Hedef Yapı Üretimi: İstenen özelliklere göre yeni adaylar önermek için üretken AI kullanmak.

Özellik Tahmini

Moleküler Temsili Öğrenme: Çözüm alanındaki adayların özelliklerini tahmin etmek için öğrenilmiş moleküler temsilleri kullanmak.
Atomistik Simülasyon: Yüksek düzeyde özellik tahmini yapmak için AI temelli yaklaşımlar (MLIPs, GNN’ler) uygulamak.
Densite Fonksiyonel Teorisi (DFT) Doğrulaması: Tahmin edilen özellikleri DFT simülasyonları ile doğrulamak.

Deneysel Doğrulama

Aday Önerisi: Kimyasal bilgiyi keşfetmek ve doğrulanmış özellikler doğrultusunda laboratuvar için adaylar önermek.
Deneyim Otomasyonu: AI destekli öz sürüşlü laboratuvar ve aktif öğrenme ile laboratuvar sentezini ve testlerini hızlandırmak.

Kimyada ve Malzeme Biliminde Ar-Ge’yi Hızlandırmak

NVIDIA ALCHEMI, kimya ve malzeme bilimi konusundaki Ar-Ge süreçlerini AI’nın gücü ile hızlandırmayı hedeflemektedir. ALCHEMI, geliştiriciler ve araştırmacılar için NVIDIA NIM-hızlandırma mikro servisleri ve API’ler içerecektir.

Yeni potansiyel adaylar öneren üretken AI modellerinin oluşturulması ve devreye alınması.
Geleneksel ab initio simülasyon yöntemlerine göre doğruluk ve hesaplama maliyeti arasında bir denge sağlayan AI vekil modellerinin geliştirilmesi ve kullanılması.
Hızlı tarama için malzeme temsilini özelliklere eşlemek üzere erişilebilir kimyasal ve malzeme bilimi bilgisi araçları ve önceden eğitilmiş temell modeler.
Yeni kullanım durumları için AI modellerini eğitmek ve ince ayar yapmak amacıyla sentetik veri seti oluşturma simülasyon araçları.

NVIDIA ALCHEMI, belirli bir AI vekil modelleme uygulamasını hızlandırmayı hedefleyen ilk hızlandırılmış malzeme keşif NIM’ini tanıtıyor; bu model, makine öğrenimi arasında atomik potansiyeller (MLIPs) sınıfına odaklanmaktadır.

Makinel Learning Interatomic Potentials

Bazı geleneksel hesaplama yöntemleri, hassasiyet ve hesaplama maliyeti açısından çeşitli özellikler taşımaktadır. Daha yüksek bir hassasiyet sunan bir yöntem, hesaplama açısından oldukça yüksek maliyetler doğurur. Örneğin, DFT hesaplamaları 10 atomluk bir sistem için birkaç dakika sürerken, 100 atom için saatler alıyor. Ancak 1,000’den fazla atom içeren bir sistemde, DFT (atom sayısıyla birlikte kübik olarak ölçeklendiği için) haftalar sürebiliyor ve bu durum büyük karmaşık sistemler için pratik olmayabiliyor.

MLIPs, hassasiyet ve hesaplama maliyetini dengelemek için AI’nın gücünü kullanarak atomik yapıların potansiyel enerji ve atomik kuvvetlere olan haritalanmasını sağlamaktadır. MLIPs genellikle, atomları düğüm ve aralarındaki mesafeleri kenar olarak temsil eden GNN’ler kullanarak atomik yapıları graf olarak temsil eder. Bu şekilde, bir molekülü veya malzemeyi oluşturan atomlar arasındaki uzamsal ilişkilere kolaylıkla erişebilirler.

MLIPs, kimya, malzeme bilimi ve biyolojide geniş uygulama alanlarına sahiptir. Bu, fizik-bilgilendirilmiş sinir ağları (PINNs) ile karşılaştırıldığında geniş kapsamlıdır; çünkü PINNs, esas olarak hesaplamalı akışkanlar dinamiği ile ilgili fiziksel denklemleri entegre ederler.

Geometri Rahatlatma

Kimyasal ve malzeme keşif süreçlerinde önemli bir adım, stabil malzemeleri kararsız olanlardan ayırmak için geometri rahatlatmadır. Bu, üretken modellerle ilgili süreçlerde oldukça kritik bir aşamadır. Bir malzemenin enerjisi, her atom üzerindeki kuvvetleri değerlendirerek ve atom konumlarını potansiyel enerji çukurunun dibine doğru ayarlayarak minimize edilir. Her bir malzeme adayı, bu enerji minimumuna ulaşmak için binlerce rahatlatma adımı gerektirebilir.

NVIDIA Toplu Geometri Rahatlatma NIM

MLIPs, geometri rahatlatma hesaplamalarını önemli ölçüde hızlandırırken, uygulama hâlâ zaman alıcı olabiliyor. Bu nedenle, NVIDIA, potansiyel batarya malzemelerinin geometri rahatlatma hesaplamalarını hızlandırmayı amaçlayan NVIDIA Toplu Geometri Rahatlatma NIM’ini geliştirmiştir. Bu NIM, yalnızca bir API’yi açığa çıkaran bir konteynırdır. Geleneksel CPU tabanlı simülasyon yükleri, MLIPs’in tam performansını kullanmakta eksikte kalmakta ve CPU-GPU veri hareketinde önemli iletişim yüklerine neden olmaktadır.

Yuvarlak hesaplamalar için NVIDIA Warp ile birlikte kullanılabilen bir Python geliştirici çerçevesi sunarak, belirli bir zaman süresi içinde yapılacak birden fazla geometri rahatlatma simülasyonu başlatabilmekte ve mevcut GPU kaynaklarının kullanımını en üst düzeye çıkarmaktadır. Bu, her adayın binlerce rahatlatma adımı gerektirdiği ve ciddi hız kazanımı sağlandığı kritik bir süreçtir.

Yapılan testlerde 2,048 küçük ve orta boy inorganik kristal sistemi kullanılarak, NVIDIA H100 80 GB GPU’da MACE-MP-0 modeli ile ciddi hız kazançları sağlanmıştır. Geleneksel yöntemlerle bu sistemlerin hesaplanması 15 dakika sürerken, NIM ile birlikte bu süre 36 saniyeye düşmüştür; bu da %25 hız kazanımını ifade etmektedir. Toplu boyutun 1’den 128’e çıkarılması ise toplam süreyi 9 saniyeye düşürerek %100 hız kazancı sağlanmıştır.

Toplu Geometri Rahatlatma NIM	Toplu boyut	Toplam zaman (s)	Sistem başına ortalama zaman (s/sistem)	Yaklaşık hız kazanımı
Kapalı	1	874	0.427	1x
Açık	1	36	0.018	25x
Açık	128	9	0.004	100x

Tablo 1. 2,048 periyodik inorganik kristal sistemleri için NVIDIA Toplu Geometri Rahatlatma NIM kullanımı ile hızlandırılmış geometri rahatlatma

81 851 küçük ve orta boy organik molekül üzerinde yapılan karşılaştırmalı testte, AIMNet2 ve ASE FIRE kullanılarak NIM açık olduğunda %60 hız kazanımı elde edilmiştir. Toplu boyutun 1’den 64’e çıkarılması ile birlikte ise %800’e kadar hız kazanımları sağlanmıştır. Bu haftalarca süren simülasyonları saatlere, saatleri dakikalara indirerek yenilikçi süreçler sunmaktadır.

SES AI, lityum-metal bataryaların lider geliştiricilerinden biri olarak NVIDIA ALCHEMI NIM mikro servisini kullanarak elektrikli araçlar için elektrolit malzemelerinin belirlenmesini hızlandırmayı hedeflemektedir. SES AI’nın CEO’su Qichao Hu, “Yapay zeka destekli malzeme keşfi ile lityum batarya teknolojisini ilerletmeyi taahhüt ediyoruz. ALCHEMI ile keşif sürecimizi köklü bir şekilde hızlandırmayı planlıyoruz,” demektedir.

NVIDIA Toplu Geometri Rahatlatma NIM ile Başlamak

NVIDIA Toplu Geometri Rahatlatma NIM ile başlamak için gerekenler şunlardır:

Python ve ASE ile çalışma bilgisi
Bir Docker konteynırının çalıştırılmasına dair bilgi
MACE-MP-0 (malzemeler) veya AIMNet2 (moleküller) modeline ihtiyaç

Prosedür

NVIDIA NIM, bir API’yi açığa çıkaran bir konteynırdır ve NIM ile etkileşim iki ana adımda gerçekleşir:

İlk olarak, konteynırın başlatılması gerekir:

docker run --rm -it --gpus all 
-p 8003:8003 
<NIM konteyner adresi>

Ayrıca, --gpus all ile NIM’in hangi cihazlarda yükleyeceği ayrı model ve optimize edici örneklerini belirlemekteyiz. Eğer birden fazla cihaz varsa, NIM, mümkün olan model örnekleri arasında talepleri dağıtacaktır. İkincisi, yerel portu 8003’e açarak, NIM API’sinin varsayılan iletişim portuna yönlendirme yapılmasını sağlıyoruz.

Konteynır başlatıldıktan sonra isteklerinizi göndermeye başlayabilirsiniz:

import os, requests, json
import numpy as np 
from ase import Atoms
from ase.io.jsonio import MyEncoder, decode

atoms: list[Atoms] = # Buraya ase.Atoms girişi ekleyin

# NIM URL'sini tanımlayın
url: str = 'http://localhost:8003/v1/infer'

# Giriş atomlarını json'da hazırlayın
data = {"atoms": json.dumps(atoms, cls = MyEncoder)}
headers = {'Content-Type': "application/json"}

# NIM'e istek gönderin
response = requests.post(url, headers = headers, json=data)
response.raise_for_status()

# json çıktısını ase.Atoms'a dönüştürün
optimized_atoms = decode(response.json())

Dikkat Edilmesi Gerekenler

Ase, popüler bir moleküler modelleme Python paketidir ve giriş verileri ase.Atoms biçiminde ifade edilmektedir.
Kullanıcı, NIM’in http://localhost:8003/v1/infer bağlantısını sağlamalıdır.
Kullanıcı, ase.Atoms‘u .json string’ine dönüştürmeli ve requests kütüphanesini kullanarak istek göndermelidir.

Sonuç

NVIDIA Toplu Geometri Rahatlatma NIM’sinin kullanımı, MLIP hesaplamalarını %800 oranında hızlandırmıştır. Bu hızlı geliştirme, milyonlarca adayın yüksek verimli simülasyonlarını mümkün kılmakta ve yüksek kaliteli verilerle eğitilen yeni nesil temell modelleri için kapılar açmaktadır. Bu, NVIDIA ALCHEMI ile kimyasal ve malzeme keşif süreçlerini sonuna kadar hızlandırarak, daha sürdürülebilir ve sağlıklı bir geleceğin bulunmasına katkıda bulunmaktadır.

NVIDIA Toplu Geometri Rahatlatma NIM‘in indirilmesi için bildirim almak üzere kayıt olun.

SON DAKİKA

NVIDIA ALCHEMI ile AI Destekli Malzeme Keşfini Devrim Niteliğinde Yeniden Şekillendirmek