Geleneksel bilgisayarla ilaç keşfi, neredeyse tamamen yüksek oranda görev spesifik hesaplama modellerine dayanmaktadır ve bu modeller, hit bulma ve lider optimize etme süreçlerinde kullanılmaktadır. Bu özel modellerin yeni görevlere uyarlanması, önemli ölçüde zaman, hesaplama gücü ve uzmanlık gerektirir; bu zorluklar, araştırmacıların aynı anda birden fazla hedef veya özellik üzerinde çalışması durumunda daha da artar.
Özel modellere olan bu bağımlılığa rağmen, genel modellerin yükselişi, bu çok yönlü çerçevelerin bir miktar kimyasal sezgi kazandırabileceği umudunu doğurmuştur. Yani, bu modeller çeşitli ilaç keşif görevlerini ele alabilir ve özel modellerin sıklıkla gözden kaçırdığı çözümler ve desenleri ortaya çıkarabilirler.
Yeni tanıtılan SAFE-GPT modeli, moleküler üretim alanında önemli bir değişim temsil ederek, ilaç tasarımında tıp kimyacılarının yaklaşımına uygun bir kimyasal sezgi çerçevesi sunmasıyla dikkat çekmektedir. Sıralı Bağlama Tabanlı Fragman Gömme (SAFE) temsilini (sonraki bölümlerde açıklanacaktır) kullanarak SAFE-GPT, önceki moleküler üretim modellerindeki önemli sınırlamaları aşmış ve moleküler yapıların esnekliğini ve modülerliğini tam olarak yakalamıştır. Bu, SAFE-GPT’nin SMILES tabanlı üretim modellerini, grafik sinir ağlarını ve erken fragment tabanlı modelleri geride bırakmasını sağlamıştır.
SAFE-GPT dönüştürücü mimarisi yüksek etkili olsa da, çeşitli ilaç keşif görevleri için verimliliği, ölçeklenebilirliği ve uyarlanabilirliği açısından dikkat çeken sınırlamalara sahiptir.
SAFE Görünümü
Moleküler temsilin doğruluk, verimlilik ve çok yönlülük açısından kritik öneme sahip olduğu bilinmektedir. Bu temsiller, kullanıcıların kimyasal sezgileriyle uyumlu olmalıdır ki yaygın olarak benimsenebilsin.
SAFE temsili, hem SAFE-GPT hem de GenMol tarafından kullanılan, moleküllerin tanımlanma şeklini yeniden düşünerek, bunları modüler, birbiriyle bağlantılı parçalar halinde ayrıştırır. Geleneksel SMILES gibi moleküler notasyonların aksine, SAFE, molekülleri sıralı dizilimler olarak tanımlamak yerine, parçaların sırasız bir dizisi olarak ele alır. Bu yöntem, kimyanın doğasında olan esnekliği ve modülerliği korurken mevcut SMILES ayrıştırıcılarıyla uyumlu kalır.
SAFE, özellikle çerçeve süslemesi, bağlayıcı tasarımı ve motif genişletme görevleri için iyi bir şekilde uygundur çünkü bu problemleri dizilim tamamlama görevlerine indirger. Moleküler çerçevelerin bütünlüğünü koruyarak ve karmaşık yapıların işlendiği bir ortam sunarak, SAFE, karmaşık grafik tabanlı modellere ihtiyaç duymadan sezgisel, parça bazlı moleküler tasarım yapılmasını sağlar.
GenMol Çıkarım Örneği
GenMol NIM mikroservisi ve ona eşlik eden not defterleri, SAFE veya SMILES ve maske dizgileri ile değişken çıkarım taleplerini basitleştirir. De novo üretim yapmak için yalnızca saf bir maske ve istenen molekül sayısı yeterlidir:
generator = GenMol_Generator(invoke_url='http://127.0.0.1:8000/generate)
# bir SMILES veya SAFE dizi stringi sağlayın
molecules = generator.inference(smiles='[*{15-25}]',num_molecules=20)
Şekil 2, örnek çıktıyı göstermektedir.
SAFE-GPT ve GenMol Karşılaştırması
GenMol ve SAFE-GPT, AI tabanlı moleküler üretim alanında iki farklı yaklaşımı temsil etmekte olup, her birinin kendine özgü güçlü ve zayıf yönleri bulunmaktadır.
Özellik | GenMol | SAFE-GPT |
Çözümleme | Paralel (oto-regresif olmayan) | Sıralı (oto-regresif) |
Görev çeşitliliği | Geniş | Görev spesifik uyarlama gerektirir |
Verimlilik | Ölçeklenebilir ve verimli | Hesaplama yoğun |
Çeşitlilik-kalite dengesi | Yüksek denge | Orta |
SAFE-GPT, oto-regresif bir dönüştürücü mimarisi üzerine inşa edilmiş, çerçeve süslemesi ve bağlayıcı tasarımı gibi fragment kısıtlı görevler için güçlü bir araçtır. Sıralı çözümleme kullanması, bu özelleşmiş senaryolarda hassasiyet ve kimyasal geçerlilik sağlamaktadır. Ancak, sıralı doğası ve görev spesifik tasarımı, hesaplama açısından yoğun olup, yeni görevlere uyarlanmasını zordur.
GenMol, kesintisiz difüzyon tabanlı mimarisi ve paralel çözümlemesi ile birçok sınırlamayı aşarak hesaplama verimliliğini ve görev çeşitliliğini artırmaktadır. Moleküler üretimin kapsamını hedefe yönelik lider optimize etme gibi daha geniş sorunları içerecek şekilde uzatarak, f-RAG ve REINVENT gibi yaygın kullanılan modellere göre daha iyi performans sergilemektedir.
Moleküler Üretim ve Hesaplama Etkinliği
SAFE-GPT, molekülleri parça parça üreten oto-regresif bir yapı kullanırken, GenMol ise parçaları aynı anda işleyen bir mimariye sahiptir. Bu durum, GenMol’un moleküler bağlamı göz önüne alarak, token’ların ve parçaların karışık sıralamasına bağımlı olmaksızın ilerlemesini sağlar ve bu sayede SAFE-GPT’ye kıyasla fragment kısıtlı moleküler üretim görevlerinde daha iyi sonuçlar elde eder.
Sonuçta, GenMol’un sunduğu kesintisiz difüzyon yoluyla, parçaların maskesinin dinamik olarak değiştirilmesiyle kimyasal alanı keşfetme yeteneği önemli ölçüde artmaktadır. Bu strateji, moleküllerin keşfedilmesini ve optimize edilmesini sağlayarak, hit üretim ve lider optimize görevlerinde kullanılabilir.
Sonuç
Moleküler üretim modellerinin önemi, yalnızca üretim süreciyle ilgili değil, aynı zamanda bu sürecin nasıl yeniden düşünülmesi gerektiğiyle ilgilidir.
Piyasa süresinin, hastalar için yaşam kaybı olabileceği bir sektörde, daha geniş bir şekilde kullanılabilir modeller, araştırmacılara keşif süreçlerini basitleştirerek, sonuçları optimize etmek ve kimyasal olarak olanakları genişletmek için esnek, verimli ve kesin araçlar sunma konusunda yardımcı olabilir. Bu, çalışma süreçlerini elle yapılan aşamalardan AI destekli yenilik süreçlerine taşımada kritik bir sıçrama temsil eder.
Her iki model de, araştırma projelerinin özel ihtiyaçlarına bağlı olarak değerli araçlar sağlamaktadır. SAFE-GPT, sıkı fragment kısıtlamaları ile motif genişletme ve çerçeve üretimi gibi projeler için mükemmel bir seçimken, GenMol daha esnek ve çeşitliliği artırıcı bir çerçeve arayan araştırmacılar için daha uygundur.
GenMol’ü NVIDIA NIM’de hemen deneyebilirsiniz ya da GitHub üzerindeki örnek kodları keşfederek, GenMol’ü hedefe yönelik hit optimizasyonu, lider optimizasyonu ve daha fazlası için nasıl kullanacağınızı öğrenebilirsiniz. Bu yaklaşımları daha derinlemesine keşfederek, araştırma ihtiyaçlarınıza en uygun çözümleri belirleyin ve ilaç keşfi çalışmalarınızı hızlandırın.