“DeepSeek’in Sırrı: Bir Tutam Google Gemini”

Bu yılın başlarında, DeepSeek, güçlü bir AI modeliyle beklenmedik bir şekilde sahneye çıktı. Şirket, AI modelinin en son güncellemesini duyurdu ve bu güncellemenin Google Gemini’yi kullanarak kendini eğitmiş olabileceği iddia ediliyor.

DeepSeek, Google’ın Gemini’siyle Kendini Eğitiyor

Sam Paech’in X’teki bir gönderisine göre, DeepSeek’in en son modelinin önceki sürümünden “farklı” ses çıkarmasının sebeplerinden biri Google Gemini’yi kullanarak eğitilmiş olması. Bu düşünceye sahip olan tek kişi Paech değil; SpeechMap geliştiricisi de DeepSeek’in izlerinin Gemini’ninkilere çok benzediğini belirtmiştir. Bilmeyenler için, izler (traces), AI modelinin bir sonuca ulaşmadan önce geçirdiği düşünce süreçleridir.

DeepSeek geliştiricilerinin daha önce başka AI’ları kendi modellerini eğitmek için kullandığı yönünde suçlamalarla karşılaştığını belirtmek gerekir. DeepSeek ilk ortaya çıktığında, OpenAI, DeepSeek’in kendisini ChatGPT kullanarak eğitmiş olabileceğinden şüphelenmişti. Bu durum, DeepSeek’in eğitim sürecinin rakiplerine göre çok daha düşük maliyetli olduğunu öne sürmesinin nedenlerinden biridir.

Etik Olarak Soru İşareti Taşıyor, Ama Etkili

Diğer AI modellerinin “öğrenmek” için ham veri kullandığı halde, DeepSeek, kendi kendini eğitmek için damıtma (distillation) adını verdiği bir yöntemi kullanıyor. Bu yöntem, diğer AI modellerinden aldığı çıktıların kendi kendine öğretim amacıyla kullanılması ile gerçekleşiyor. Bu, öğretmen-öğrenci konseptine benzeyen bir süreçtir; öğretmen, daha önceki bilgi edimlerini damıtarak öğrencinin anlayabileceği bir biçime getirir.

Bunun daha verimli bir yöntem olduğu doğrudur; ancak, bu durumun etik boyutu da sorgulanıyor. Örneğin, OpenAI’nin hizmet şartları, müşterilerinin kendi rakip AI’larını oluşturmak için şirketin AI modeli çıktılarını kullanmasını yasaklamaktadır. Eğer bu doğruysa, DeepSeek, OpenAI’nin politikalarını açıkça ihlal etmiş sayılmaktadır.

Zorlu Pazar Koşullarında Stratejik Adımlar

DeepSeek’in eylemleri etik olarak sorgulansa da, bazıları bunun mantıklı olduğunu düşünüyor. Örneğin, AI2’den araştırmacı Nathan Lambert’a göre, DeepSeek’in kendisini Google Gemini kullanarak eğitmesinin mantıklı olduğunu belirtti. Lambert, “Eğer ben DeepSeek olsaydım, kesinlikle en iyi API modelinden bolca sentetik veri üretirdim. GPU’ları az ve nakitleri bol. Bu onlar için etkili bir hesaplama çözümü.” dedi.

ABD-Çin ticaret savaşının Çin’in teknolojik ilerlemelerini engellediğini unutmayalım. Bu durum, daha gelişmiş yarı iletken teknolojilerine erişimi kısıtlamak ve belirli türde teknolojilerin Çin’e ihracatını sınırlamak gibi etkilere yol açıyor. Bu nedenle, DeepSeek gibi Çinli şirketlerin modellerini eğitmek için alternatif yollar aramaları şaşırtıcı değil.