SON DAKİKA

İş Dünyası

Google’ın Yeni Ironwood Çipi, Dünyanın En Güçlü Süper Bilgisayarından 24 Kat Daha Güçlü

Günlük ve haftalık bültenlerimize katılın, sektör lideri AI haberleriyle ilgili en son güncellemeler ve özel içerikler için. Daha Fazla Bilgi


Google Cloud, Çarşamba günü, Tensor İşlem Birimi (TPU) yedinci neslini Ironwood adıyla tanıttı. Dünyanın en hızlı süper bilgisayarından 24 kat daha fazla işlem gücü sunduğunu iddia eden bu özel yapım AI hızlandırıcı, ölçeklendirildiğinde etkileyici bir performans sergiliyor.

Google’ın on yılı aşkın AI chip geliştirme stratejisinde önemli bir değişimi temsil eden yeni çip, Google Cloud Next ’25 etkinliğinde duyuruldu. Önceki TPU nesilleri eğitim ve çıkarım iş yükleri için tasarlanmışken, Ironwood, yalnızca çıkarıma odaklanan ilk özel çip olma özelliği taşıyor — yani eğitimli yapay zeka modellerinin tahminlerde bulunmak ya da yanıtlar üretmek için kullanılması.

Güçlü performans: Ironwood’un 42.5 exaflops gücü

Ironwood’un teknik özellikleri oldukça dikkat çekici. 9,216 çipten oluşan bir işlemci poduna ölçeklendirildiğinde, 42.5 exaflops hesaplama gücü sağlarken, şu anda dünyanın en hızlı süper bilgisayarı olan El Capitan’ın 1.7 exaflops gücünü geride bırakıyor. Her bir Ironwood çipi, 4,614 teraflops pik hesaplama gücü sunuyor.

Ironwood ayrıca bellek ve bant genişliği alanında önemli gelişmelere sahip. Her çip, geçen yıl açıklanan Google’ın önceki nesil TPU’su Trillium’dan altı kat daha fazla olan 192GB Yüksek Bant Genişliği Belleği (HBM) ile geliyor. Bellek bant genişliği, Trillium’a kıyasla 4.5 kat artırarak 7.2 terabit/saniye seviyesine ulaşmış durumda.

Güç tüketiminin de önemli bir faktör olduğu günümüzde, Ironwood, Trillium’a göre watt başına iki kat daha fazla performans sunarken, 2018’deki Cloud TPU’nun neredeyse 30 katı daha enerji verimli.

Modellerden düşünen makineler: Google’ın çıkarıma odaklanmasının önemi

Çıkarıma olan vurgunun artması, AI zaman çizelgesinde önemli bir dönüm noktasını işaret ediyor. Yıllardır sektör, birbirinden büyük temel modeller geliştirmeye odaklanmışken, Google’ın çıkarım optimizasyonuna geçişi, dağıtım verimliliğinin ve akıl yürütme yeteneklerinin ön plana çıktığını gösteriyor.

Eğitim bir kez yapılırken, çıkarım işlemleri her gün milyarlarca kez gerçekleşiyor. AI ekonomisi, modellerin giderek karmaşıklaşması ve hesaplama gereksinimlerinin artmasıyla birlikte, çıkarım maliyetleriyle doğrudan ilişkilidir.

Gemini’nin düşünme motoru: Google’ın yeni nesil modelleri nasıl gelişmiş donanımı kullanıyor

Google, Ironwood’u, “düşünme yetenekleri doğal olarak yerleştirilmiş” olarak tanımladığı en gelişmiş AI modellerinin temeli olarak konumlandırıyor; bu modellerden biri Gemini 2.5’dir.

Etkinlikte, Google, karmaşık akıl yürütme için tasarlanmış olan Gemini 2.5 Pro ile günlük uygulamalar için kritik bir yanıt verme süresi sağlamakta olan Gemini 2.5 Flash adında daha uygun maliyetli bir model de tanıttı.

Şirket ayrıca, metinden görsele, metinden videoya ve yeni duyurulan bir müzik modeli olan Lyria’ya kadar uzanan tüm yaratıcı medya modellerinin tam alanını gösterdi. Bu araçların bir arada nasıl kullanılabileceğini gösteren bir tanıtım gerçekleşti.

Silikon ötesi: Google’ın kapsamlı altyapı stratejisi

Ironwood sadece Google’ın daha geniş AI altyapı stratejisinin bir parçasıdır. Şirket, Cloud WAN adında, işletmelere Google’ın gezegen ölçeğindeki özel ağ altyapısına erişim sağlayan bir yönetilen geniş alan ağı hizmeti de duyurdu.

Google, AI iş yükleri için Pathways adı verilen yazılım tekliflerimi genişletiyor. Pathways, müşterilerin yüzlerce TPU üzerinde model sunumunu ölçeklendirmesine olanak tanıyor.

Çoklu ajan ekosistemi: Google’ın AI sistemleri için cesur planı

Donanımın yanı sıra, Google, çoklu ajana dayalı sistemler etrafında bir vizyon belirledi. Şirket, Ajan Geliştirme Kiti (ADK) duyurdu, bu kit geliştiricilerin birden fazla AI ajanın birlikte çalıştığı sistemler oluşturmasına olanak tanıyor.

En önemlisi, Google, farklı frameworkler etkinlikleri ile yapılmış AI ajanlarının birbirleriyle iletişim kurabilmesi için “ajanlar arası etkileşim protokolü” (A2A) geliştirdi. Bu sayede AI sistemlerinin entegrasyonunu kolaylaştırmayı hedefliyor.

Google, bu standartı geliştirmek için 50’den fazla endüstri lideriyle iş birliği yapıyor. “2025, jeneratif AI’nin tek soruları yanıtlamaktan karmaşık problemleri çözmeye geçtiği bir geçiş yılı olacak.” diye öngörüyorken, Vahdat, yeni teknolojilerin benimsenmesine yönelik umut verici bir bakış açısı sunuyor.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri