“`html
DeepSeek’in Yenilikçi Yapısı
Çin merkezli startup DeepSeek, R1 adını verdiği gelişmiş yapay zeka modeli ile teknoloji dünyasında dikkatleri üzerine çekti. Bu modelin, OpenAI‘nin o1 modeli ile rekabet edebileceği düşünülüyor. DeepSeek’in yalnızca 6 milyon dolara ve 2,048 GPU ile modeli eğittiğini iddia etmesine rağmen, sektör analiz firması SemiAnalysis, firmanın 1.6 milyar dolarlık donanım masrafına sahip olduğunu ve yaklaşık 50,000 Hopper GPU kullandığını rapor etti. Bu durum, DeepSeek’in yapay zeka eğitimi ve çıkarımı konularında devrim yarattığı fikrini zayıflatıyor.
Donanım Yatırımları ve Operasyonel Maliyetler
SemiAnalysis’in raporuna göre, DeepSeek’in işletme altyapısı yaklaşık 50,000 Hopper GPU içermekte. Bu kaynaklar arasında 10,000 H800 ve 10,000 H100 unitleri yer almakta; ayrıca H20 birimleri için de ek alımlar yapılmış. Şirketin sunucu yatırımları toplamda yaklaşık 1.6 milyar dolar, işletme maliyetlerinin ise 944 milyon dolar civarında olduğu belirtiliyor.
Yerli Ağırlık ve Rekabet Avantajları
DeepSeek, Çinli hedge fonu High-Flyer tarafından kurulmuştur. Bu fon, yapay zekaya erken dönemde yatırım yapmış ve GPU’lara büyük yatırımlar gerçekleştirmiştir. 2023 yılında DeepSeek, yapay zeka alanına özgü bir girişim olarak ayrıldı. Diğer birçok rakibinin aksine, DeepSeek kendi bünyesinde finanse edilmekte, bu da ona hızlı karar alabilme avantajı sunmaktadır. SemiAnalysis’e göre, şirketin teknolojisine yaptığı yatırım ise 500 milyon doları geçiyor.
DeepSeek’in önemli bir farkı, kendi veri merkezlerini işletiyor olmasıdır; bu, çoğu AI startup’ının dış kaynaklardan hizmet almasıyla karşılaştırıldığında bir avantaj sunmaktadır. Bu bağımsızlık, deneyler üzerinde tam kontrol sağlarken, dış kaynakların neden olduğu gecikmeler olmaksızın hızlı iyileştirmeler yapmasına olanak tanımaktadır.
İnsan Kaynakları ve İnovasyon
DeepSeek, beklenmedik bir şekilde yalnızca Çin anakarasından yetenekler işe almaktadır. Tayvan veya ABD gibi yerlerden çalışan temin edilmemektedir. Şirket, Peking Üniversitesi ve Zhejiang Üniversitesi gibi kurumlardan problem çözme becerilerine sahip bireyleri hedef alarak rekabetçi maaşlar sunmaktadır. Araştırmalara göre, DeepSeek’deki bazı AI araştırmacıları, diğer önde gelen Çinli AI firmalarındaki maaşları aşarak 1.3 milyon dolardan fazla kazanmaktadır.
Bu yetenek akışı, DeepSeek’in Multi-Head Latent Attention (MLA) gibi yeniliklerin öncüsü olmasını sağladı. Bu gelişimler, aylar süren çalışmalar ve önemli GPU kullanımı gerektirmiştir. DeepSeek’in yaklaşımı, verimlilik ve algoritmik iyileştirmelere odaklanarak yüksek kapasiteli GPU’lara olan talebin azalabileceği düşüncesini doğurmuştur.
Hype ve Gerçekler
DeepSeek, son zamanlarda yalnızca 6 milyon dolara model eğittiğini iddia etti ve bu, büyük bir heyecan yarattı. Fakat bu rakam, yalnızca ön eğitim için gereken GPU zamanını ifade etmekte olup, araştırma, model iyileştirme ve veri işleme masraflarını içermemektedir. Gerçekte, DeepSeek başlangıcından bu yana yapay zeka geliştirmeleri için 500 milyon dolardan fazla harcama yapmıştır. Bürokrasi yükünden muaf olan bu şirket, yenilikçiliği hızla ilerletebildiği için dikkat çekmektedir. Aslında, Elon Musk geçen yıl “Eğer yapay zeka alanında rekabetçi olmak istiyorsanız, her yıl milyarlarca harcamanız gerekiyor” demişti; görünüşe göre DeepSeek bu yönde önemli yatırımlar yapmıştır.
“`