Bilim alanında kullanılan yapay zeka (YZ) modelleri, genellikle doğanın işleyişi hakkında tahminler yapacak şekilde eğitilir. Örneğin, bir biyomolekülün yapısını tahmin etmek veya yeni bir katı maddenin batarya malzemesi olma potansiyelini değerlendirmek gibi görevler yüksek hassasiyet ve doğruluk gerektirir. Ancak, bilimsel verilerin genellikle kıt olması, YZ için ek bir zorluk oluşturur; çünkü metin ve görsel içerik gibi diğer kaynaklardan daha fazla veri bulunmaktadır.
Çözümlere olan yüksek talep ve sınırlı kaynaklar karşısında, araştırmacılar doğanın yasalarını YZ modellerine entegre etme gibi yenilikçi yaklaşımlara yönelmektedir. Bu şekilde modellerin doğruluğu artırılır ve veri bağımlılıkları azaltılır.
Eşitlikçi Sinir Ağları ile Tanışın
Son zamanlarda başarılı bir şekilde uygulanan yöntemlerden biri, bilimsel problemin simetrilerini YZ modeline entegre etmektir. Eşitlikçi Sinir Ağları (ESAn), simetrik dönüşümler altında eşitlik kavramını temel alan bu sinir ağı mimarileridir. Basitçe ifade etmek gerekirse, EŞAn’lar problemi esnasında altında yatan simetrileri dikkate alacak şekilde tasarlanmıştır. Örneğin, bir ESAn’a verilen girdi döndürüldüğünde, çıkış da buna uygun olarak dönecektir. Bu sayede model, aynı nesne ya da modeli farklı yönlerde görse bile tanıyabilmektedir.
3D’de Simetriyi Koruma
ESAn’ların günümüzde en çok kullanıldığı alanlardan biri, girdi ve çıkış arasındaki ilişkiyi simetri işlemleri sırasında korumaktır. Örneğin, bir ESAn 3D bir molekül modelini girdi olarak aldığında, çıkarılan özelliklerin tahminini yapabilir. Molekül farklı açıdan döndürülse bile, aynı özellikleri tahmin edebilir; ek veriye veya veri çoğaltma ihtiyacına gerek kalmaz. ESAn, molekülün döndürülmesinin temel özelliklerini değiştirmediğini “anlamaktadır”.
ESAn’ların Zorlukları
Simetri grubu adı verilen temel elemanlar ile çalışamayan birçok YZ modelleri, Tensor Alan Ağları, LieConv, Cormorant, SE(3)-Transformer, NequIP ve diğerleri gibi özgün yaklaşımlar kullanmaktadır. Bu YZ yapıları, çıktıların simetrik dönüşümlere uygun şekilde yansıtılmasını sağlamak için irreducible representations (irreps) gibi matematiksel kavramlar kullanır. Ancak bu yapıların teorik karmaşıklığı ve hesaplama zorlukları, ESAn’ların benimsenmesinin önünde engel oluşturabilmektedir. Ayrıca, mevcut API ve araçların kısıtlı olması, uygulamaları geliştirmeyi zorlaştırır.
cuEquivariance İle Hız Kazanma
NVIDIA, bu zorluklarla başa çıkmak amacıyla cuEquivariance adlı yeni bir matematik kütüphanesi geliştirmiştir. Bu kütüphane, eşitlikçi sinir ağlarının hızını artıran CUDA hızlandırmalı yapı taşları sunmaktadır. cuEquivariance, genel bir çerçeve olan Bölümlü Tensor Ürünü (STP) tanıtıyor. STP, irreps ile matematiksel işlemleri organize eder ve daha önce bahsedilen seyrek karışım katsayılarını hesaba katarak işlemleri genel bir şekilde tanımlar.
cuEquivariance, ayrıca yaygın olarak kullanılan STP’lerin birçok örneğini hızlandırmak için özel CUDA kernelleri kullanıyor. Bu, birden fazla bellek bağlı işlemlerin arka arkaya yapılması nedeniyle yaşanan zaman kaybını düzeltmektedir. Ayrıca, belleğin erişim düzeninin NVIDIA GPU mimarisine daha iyi uyum sağlaması için yeniden yapılandırılmasıyla performansı önemli ölçüde artırmaktadır.
Örnek Kullanımlar
Özellikle DiffDock (protein-ligand bağlanma pozunu tahmin eden bir difüzyon modeli) ve MACE (moleküler dinamik simülasyonları için yaygın olarak kullanılan makine öğrenmeli bir interatomik potansiyel) gibi popüler YZ bilim modellerinde cuEquivariance’ın etkisi belirgin bir şekilde görülmektedir. Performans artışları, çeşitli NVIDIA GPU mimarileri üzerinde test edilerek kanıtlanmıştır.
Bu eşitlikçi sinir ağı modelleri, birçok tensor işlemi içermektedir ve her model için en kritik işlemler hangileridir belirlenmiştir. Sonuçlar, her iki modelde de hız kazançları sağlamaktadır. cuEquivariance kullanılarak elde edilen veriler, bu alandaki gelecekteki yenilik potansiyelini öngörmektedir. Bu şekilde, karmaşık bilimsel problemlerin çözümlerinde devrim niteliğinde yenilikler görmek mümkün olabilecektir.
Sonuç
cuEquivariance geliştirilmesi, YZ’nin bilimdeki uygulamalarını hızlandırmak adına önemli bir adım olmuştur. Teorik ve hesaplama zorluklarını aşarak, cuEquivariance araştırmacılara ve bilim insanlarına daha doğru, verimli ve genel modeller geliştirme olanağını sunmaktadır. MACE ve DiffDock gibi modellerle sağlanan entegrasyon, ilaç keşfi, malzeme bilimi ve daha birçok alanda yenilikleri teşvik edecek ve hızlandıracaktır.
Simetrinin gücünden ve verimli hesaplamadan yararlanarak, cuEquivariance, YZ’nin bilimsel keşiflere katkıda bulunmasını sağlayacak yeni olanaklar sunmaktadır. Bu açık kaynak hızlandırılmış hesaplama araçlarıyla birlikte, büyük ölçekli verilerle birleştirilen YZ modellerinin doğruluğu artırılarak, bilimsel araştırmalarda daha geniş bir entegrasyon ve benimsenme sağlanabilir.