Bluesky, son haftalarda büyük bir popülarite kazandı. X/Twitter kullanıcılarının platformdan ayrılmasıyla birlikte, milyonlarca kişi Bluesky’yi ideal bir alternatif olarak buldu. Twitter’a rakip olarak tasarlanan bu platform, temel işlevsellik açısından oldukça benzer bir deneyim sunuyor. Ancak, Bluesky’nin yapay zeka ve gönderi gizliliği ile ilgili şartları beklentilerin altında kalmış gibi görünüyor.
Kullanıcı Göçünün Sebepleri
X’teki değişikliklerden biri, yapay zeka ile ilgili olanıdır. Elon Musk’ın platformunun yeni kullanım şartları, kullanıcı gönderilerini yapay zeka temelli geliştirmeler için kullanmasına izin veriyor. Bu durum, birçok kullanıcı için kaygı verici bulunmuyorken, özellikle sanatçılar için ciddi bir endişe kaynağı oluyor.
Bluesky’nin Güvenceleri
Diğer yandan, Bluesky’deki gönderilerinizin yapay zeka eğitimi için kullanılmayacağına dair bir taahhüt var. Bu açıklama, kullanıcıların X’ten ayrılma sebeplerinden biri için bir nebze de olsa rahatlama sağladı. Ancak, Bluesky gönderilerinizin yapay zeka eğitim amacıyla kullanılmasını engelleyemeyen üçüncü tarafların varlığı dikkat çekiyor.
Veri Seti Tartışması
Geçen hafta, Hugging Face’te makine öğrenimi kütüphanecisi Daniel van Strien, bir milyon Bluesky gönderisinden oluşan bir veri seti paylaştı ve bu durum büyük bir tartışmaya yol açtı. Hugging Face, açık kaynaklı bir makine öğrenimi kütüphanesi olarak, veri setlerinin ücretsiz kullanımına izin veriyor. Bu gelişme, Bluesky’ye kaçan kullanıcılar tarafından hoş karşılanmadı ve kısa süre içinde Daniel van Strien, veri setini kaldırarak özür diledi. “Amacım, platform için araç geliştirmeyi desteklemekti, ancak bu yaklaşımın veri toplama ilkelerine, şeffaflık ve rıza konularına zarar verdiğini kabul ediyorum. Bu hatam için özür diliyorum,” dedi.
Bluesky’nin farklı bir yönü, merkezsiz yapısıdır. Bu yapı, kullanıcıların içerik üzerinde daha fazla kontrol sahibi olmasını sağlasa da, gönderilerin herkese açık bir beslemede bulunmasına sebep oluyor. Üçüncü taraflar bu içeriklere, gönderinin sahibinin profil bilgileri ile birlikte erişebiliyorlar.
Yeni Veri Setleri ve Kullanım Amaçları
Daniel van Strien’in paylaşımına yapılan tepki üzerine, Bluesky kullanıcılarının çok sayıda gönderisini içeren yeni veri setleri hızla ortaya çıkmaya başladı. Hugging Face üzerinde, bu veri setlerinin çoğunun yapay zeka eğitimi için kullanılabileceği belirtiliyor. Bu durum, kullanıcıların tepkisinin daha da artmasına neden oluyor.
Bu üçüncü taraf veri toplama işlemleri, profesyonel etik kurallarına uymuyor. Yani, kamuya açık veri setleri yalnızca gönderileri değil, aynı zamanda bunları oluşturan kullanıcıların takma adlarını da içeriyor. Şu ana dek en büyük veri setinin, 300 milyona yakın Bluesky gönderisini içerdiği tespit edildi.
Hukuki Durum ve Veri Koruma Yasaları
Hugging Face üzerindeki en büyük veri setini toparlayan “GAYSEX” adlı kullanıcı, bu durumu alaycı bir şekilde ifade etti. “Bunu yapamazsınız! O halde paylaşmayın. Eğer kaydedilmek istemiyorsanız, o zaman paylaşmayın,” diyerek kullanıcıların internetin doğasına dair dikkatsizlik göstermelerine vurgu yaptı. Ancak, bu veri seti, yapay zeka modelleri için en az yararlı olanı; çünkü veriler düzensiz ve organize edilmeden toplandı.
Samantha Cole’ün 404 Media için yazdığı rapor, mevcut veri koruma yasalarının bu durumu durdurma konusunda etkisiz olduğunu belirtiyor. Uzmanlar, veri setinin basit bir şekilde yayınlanmasının, GDPR gibi yasaların devreye girmesi için yeterli olmadığını belirtiyor.