Makine Öğreniminde Adalet Arayışı
Makine öğrenimi modelleri, eğitim verilerinde yeterince temsil edilmeyen bireyler için tahminlerde bulunmaya çalıştıklarında başarısız olabilirler.
Örneğin, kronik bir hastalığı olan birini tedavi edebilmek için en uygun seçeneği tahmin eden bir model, çoğunlukla erkek hastalardan oluşan bir veri seti ile eğitilmişse, bu model hastane ortamında kadın hastalar için hatalı tahminlerde bulunabilir.
Veri Setinin Dengelemesi
Sonuçları iyileştirmek için mühendisler, eğitim veri setini dengelemeyi deneyebilirler. Bu işlem, tüm alt grupların eşit şekilde temsil edilmesi için veri noktalarının kaldırılmasını gerektirebilir. Ancak, veri setini dengelemeye yönelik bu yöntem genellikle büyük miktarda veri kaldırmayı gerektirir ve bu durum modelin genel performansını olumsuz etkileyebilir.
Bu sorunu aşmak amacıyla MIT araştırmacıları, eğitim veri setinde modelin azınlık alt gruplarındaki başarısızlıklarına neden olan belirli noktaları tanımlayıp kaldıran yeni bir teknik geliştirdi. Böylece çok daha az veri noktası kaldırarak, modelin genel doğruluğunu korurken, azınlık gruplara yönelik performansını artırmayı başardı.
Önyargıların Tespiti
Ayrıca bu teknik, etiketlenmemiş veri setlerinde gizli ön yargı kaynaklarını tespit etme yeteneğine de sahiptir. Etiketlenmemiş veriler, birçok uygulamada etiketli verilere göre çok daha yaygındır.
Bu yöntemin, yüksek riskli durumlarda kullanılan makine öğrenimi modellerinin adaletini artırmak için diğer yaklaşımlarla birleştirilmesi de mümkün olabilir. Örneğin, azınlık hastaların önyargılı bir yapay zeka modeli nedeniyle yanlış teşhis edilmesini önlemeye yardımcı olabilir.
MIT’li araştırmacılar, bu konuda çalışmalarını sürdürecek ve araştırmalarını gerçekleştirmek için daha kapsamlı insan çalışmalarını benimseyeceklerdir.
“Veri setini ele alıp hangi verilerin önyargıya yol açtığını anlayabilmemizi sağlayan araçlar, daha adil ve güvenilir modeller oluşturmanın ilk adımını atmamıza yardımcı oluyor”, diyor Andrew Ilyas.
Bu çalışma, kısmen Ulusal Bilim Vakfı ve ABD Savunma İleri Araştırma Projeleri Ajansı tarafından finanse edilmiştir.