Protein yapılarını anlamak için gereken yarış, hiç olmadığı kadar önemli hale geldi. İlaç keşfini hızlandırmaktan gelecekteki pandemilere hazırlanmaya kadar, proteinlerin nasıl katlandığını tahmin edebilme yeteneği, insanlığın en acil biyolojik sorunlarını çözme kapasitesini belirliyor. AlphaFold2’nin piyasaya sürülmesiyle birlikte, protein yapılarını belirlemede AI çıkarımı büyük bir ivme kazandı. Optimize edilmemiş protein yapı çıkarım araçları, kuruluşlara kaybedilen araştırma süresi ve uzatılmış hesaplama kullanımı nedeniyle milyonlarca dolara mal olabilir.
Yeni NVIDIA RTX PRO 6000 Blackwell Server Edition GPU’su ise bu durumu köklü bir şekilde değiştiriyor. AlphaFold2 devrimine rağmen, CPU tabanlı çoklu dizilim oluşturma (MSA) süreci ve verimsiz GPU çıkarım yöntemleri hâlâ sınırlayıcı adımlar olmaya devam etmekte. Önceki iş birlikleri üzerine inşa edilen ve NVIDIA Digital Biology Research laboratuvarları tarafından geliştirilen yeni hızlandırmalar, OpenFold ile, AlphaFold2 ile karşılaştırıldığında hiçbir doğruluk kaybı olmadan protein yapı çıkarımını daha önce hiç olmadığı kadar hızlı gerçekleştirmeyi sağlıyor.
Bu yazıda, RTX PRO 6000 Blackwell Server Edition GPU’ları kullanarak büyük ölçekli protein analizini nasıl yapacağınızı göstereceğiz ve yazılım platformlarına, bulut sağlayıcılarına ve araştırma kurumlarına eşi benzeri görülmemiş protein yapısı çıkarım performansı sunacağız.
Protein Yapısı Tahmininde Hız ve Ölçek Neden Önemli?
Protein katlanması, hesaplamalı biyolojideki en zorlu iş yüklerinin kesişiminde yer alıyor. Modern ilaç keşif süreçleri, binlerce protein yapısını analiz etmeyi gerektiriyor. Aynı zamanda, enzim mühendisliği projeleri de biyolojik işlevleri optimize etmek için hızlı iterasyon döngüleri talep ediyor ve tarım biyoteknolojisi uygulamaları da iklime dayanıklı bitkiler geliştirmek için devasa protein kütüphanelerini taramayı gerektiriyor.
Hesaplama gereksinimleri devasa hale gelebiliyor: Bir tek protein yapısı tahmini, metagenomik ölçeğinde MSA’lar, yinelemeli iyileştirme adımları ve genellikle saatler süren hesaplama süresi gerektiren toplu hesaplamaları içerebiliyor. Tüm proteinlerin veya ilaç hedef kütüphanelerinin üzerinden geçildiğinde, bu iş yükleri CPU tabanlı altyapılarda zaman alıcı hale geliyor.
Örneğin, çoklu dizilim araçlarının doğrudan karşılaştırmasında, MMseqs2-GPU, tek bir L40S üzerinde 177 kat daha hızlı hizalamalar tamamlayarak 128 çekirdekli bir CPU’daki JackHMMER ile karşılaştırıldığında ve sekiz NVIDIA L40S GPU arasında dağıtıldığında hızda 720 kata kadar varıyor. Bu hız artışları, GPU devriminin protein biyoinformatikindeki hesaplama darboğazlarını nasıl büyük ölçüde hafiflettiğini vurguluyor.
NVIDIA, En Hızlı Protein Yapısı AI’yı Nasıl Sunuyor?
NVIDIA, cuEquivariance ve Boltz-2 NIM mikro hizmeti gibi son girişimleri temel alarak, NVIDIA Digital Biology Research laboratuvarı, RTX PRO 6000 Blackwell Server Edition ve NVIDIA TensorRT kullanarak OpenFold için devrim niteliğinde performans iyileştirmelerini doğruladı.

Yeni 2xALU talimatları ve TensorRT’yi kullanarak, MMseqs2-GPU ve OpenFold, RTX PRO 6000 Blackwell’de, AlphaFold2’den 138 kat daha hızlı bir katlanma işlemi gerçekleştirirken, ColabFold’dan yaklaşık 2.8 kat daha hızlı bir performans sergiliyor ve aynı TM-skorlarını koruyor.
İlk olarak, daha hızlı çıkarım hızı MMseqs2-GPU ile RTX PRO 6000 Blackwell üzerinde sağlandı; bu, iki soketli bir AMD 7742 CPU’daki JackHMMER ve HHBlits’e göre yaklaşık 190 kat daha hızlı çalışıyor. Buna ek olarak, OpenFold için geliştirilen özel TensorRT optimizasyonları, temel OpenFold’a göre çıkarım hızını 2.3 kat artırdı. Bu ölçümler, RTX PRO 6000 Blackwell’in uçtan uca protein yapısı tahmini için çığır açan bir çözüm olduğunu kanıtlıyor.
Hafıza Darboğazlarını Kaldırın
Ayrıca, RTX PRO 6000 Blackwell’in sunduğu 96 GB yüksek bant genişliği bellek (1.6 TB/s), tüm protein ansamblarını ve büyük MSA’ları katlayabilmesine olanak tanıyor, bu da tam iş akışının GPU’da kalmasını sağlıyor. Multi-Instance GPU (MIG) işlevselliği sayesinde, tek bir RTX PRO 6000 Blackwell, her biri bir NVIDIA L4 Tensor Core GPU’dan daha güçlü olan dört GPU gibi çalışabiliyor. Bu, bir sunucunun hızlılık veya doğruluktan ödün vermeden birden fazla kullanıcı veya iş akışı tarafından paylaşılmasına izin veriyor.
RTX Pro 6000’ın performansını hızlı protein yapısı tahmini için nasıl kullanabileceğinizi gösteren bir örnek ile birlikteyiz. İlk adım, OpenFold2 NIM’yi yerel makinenizde dağıtmaktır.
# Daha fazla bilgi için https://build.nvidia.com/openfold/openfold2/deploy adresini ziyaret edin
# Docker girişinizi, NGC API Anahtarınızı ve OpenFold NIM'i yerel sisteminizde çalıştırmak için gereken ortamı yapılandırma talimatları bulun.
# Bu komutu bir terminalde çalıştırın, aşağıda sizin adınız ve NGC API Anahtarınız ile
$ docker login nvcr.io
Kullanıcı adı: $oauthtoken
Şifre:
export NGC_API_KEY=
# NIM model indirme işleminin yeniden kullanılabilmesi için yerel NIM önbellek dizinini yapılandırın
export LOCAL_NIM_CACHE=~/.cache/nim
mkdir -p "$LOCAL_NIM_CACHE"
sudo chmod 0777 -R "$LOCAL_NIM_CACHE"
# Ardından, bu durumda GPU cihaz ID 0 kullanarak NIM konteynerini başlatın.
docker run -it
--runtime=nvidia
--gpus='"device=0"'
-p 8000:8000
-e NGC_API_KEY
-v "$LOCAL_NIM_CACHE":/opt/nim/.cache
nvcr.io/nim/openfold/openfold2:latest
# İlk çalıştırmada tüm model varlıklarını indirmenin biraz zaman alması mümkündür.
# Durumu kontrol etmek için yerleşik sağlık kontrolünü kullanabilirsiniz. Bu, NIM son noktasının çıkarım için hazır olduğunda {"status": "ready"} döndürecektir.
curl http://localhost:8000/v1/health/ready
NIM yerel olarak dağıtıldıktan sonra, çıkarım talepleri oluşturarak yerel son noktayı kullanabilir ve protein yapı tahminleri üretebilirsiniz.
#!/usr/bin/env python3
import requests
import os
import json
from pathlib import Path
# ----------------------------
# parametreler
# ----------------------------
output_file = Path("output1.json")
selected_models = [1, 2]
# SARS-CoV-2 proteomu örneği
# Spike proteini (1273 kalıntı) — aşı gelişimi için kritik
sequence = (
"MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFAST
EKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNL
REFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVD
CALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLC
FTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCY
FPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITP
CSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARS
VASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQV
KQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWT
FGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLD
KVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHD
GKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQK
EIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT"
)
data = {
"sequence": sequence,
"selected_models": [1, 2],
"relax_prediction": False,
}
print(data)
# ---------------------------------------------------------
# Gönder
# ---------------------------------------------------------
url = "http://localhost:8000/biology/openfold/openfold2/predict-structure-from-msa-and-template"
print("İstek gönderiliyor...")
response = requests.post(url=url, json=data)
# ---------------------------------------------------------
# Yanıtı görüntüle
# ---------------------------------------------------------
if response.status_code == 200:
output_file.write_text(response.text)
print(f"Yanıt dosyaya yazıldı: {output_file}")
else:
print(f"Beklenmeyen HTTP durumu: {response.status_code}")
print(f"Yanıt: {response.text}")
Protein AI İşlemlerini Hızlandırmaya Başlayın
AlphaFold2, heterojen yüksek performanslı hesaplama düğümleri gerektirirken, NVIDIA’nın protein yapısı tahmini için geliştirdiği hızlandırmalar — modüler bileşenler olan cuEquivariance, TensorRT ve MMseqs2-GPU, RTX PRO 6000 Blackwell üzerinde, dünyanın en hızlı tahmin süreleri ile tek bir sunucuda katlanmayı mümkün kılıyor. Bu, proteom ölçeğinde katlamayı herhangi bir laboratuvar veya yazılım platformu için erişilebilir kılıyor.
İlaç keşfi için yazılım platformları geliştiriyorsanız, tarım biyoteknolojisi çözümleri inşa ediyorsanız veya pandemi hazırlığı araştırmaları yapıyorsanız, RTX PRO 6000 Blackwell’in eşsiz performansı, hesaplamalı biyoloji iş akışlarınızı dönüştürecek. RTX PRO 6000 Blackwell Server Edition’ın gücü, bugün NVIDIA RTX PRO Sunucuları ve öncü bulut hizmeti sağlayıcılarının bulut örneklerinde mevcut.
Harekete geçmeye hazır mısınız? NVIDIA RTX PRO 6000 Blackwell Server Edition için bir ortak bulun ve protein katlamalarını eşi benzeri görülmemiş hız ve ölçekle deneyimleyin.
Teşekkürler
NVIDIA, Oxford Üniversitesi ve Seul Ulusal Üniversitesi’nden araştırmacılara, bu araştırmaya katkıda bulunan Christian Dallago, Alejandro Chacon, Kieran Didi, Prashant Sohani, Fabian Berressem, Alexander Nesterovskiy, Robert Ohannessian, Mohamed Elbalkini, Jonathan Cogan, Ania Kukushkina, Anthony Costa, Arash Vahdat, Bertil Schmidt, Milot Mirdita ve Martin Steinegger’e teşekkür ederiz.