Uzmanlar, Microsoft’un yeni aracının AI yanılsamalarını düzeltebileceğini iddia etmesine rağmen tedbirli olunması gerektiğini belirtiyor.

Mikrosoft, AI’nın Yalancılığını Düzeltmek İçin Bir Hizmet Sunuyor

Mikrosoft, AI’nın yalan söylediği konusunda bir ün kazandı, ancak şimdi bunun için bir çözüm olduğunu söylüyor. Anlaşılabilir bir şekilde, bu bazı soru işaretlerine neden olacak – ve şüphe etmek için nedenler var.

Mikrosoft, faktik olarak yanlış olan AI tarafından oluşturulan metni otomatik olarak düzeltmeye çalışan “Correction” adlı bir hizmeti açıkladı. Correction öncelikle muhtemelen hatalı olan metni saptar – örneğin, bir şirketin üç aylık kazanç çağrısının yanlış alıntı yapmış olabilecek bir özeti – ardından metni bir gerçek kaynağıyla (örneğin, yüklenen transkriptler) karşılaştırarak gerçekçiliğini kontrol eder.

Bir hizmet olarak Correction

Mikrosoft’un Azure AI İçerik Güvenliği API’sinin bir parçası olarak sunulan (şu anda önizleme sürümünde olan) Correction, Meta’nın Llama ve OpenAI’nın GPT-4o gibi bir metin oluşturan AI modeliyle kullanılabilir.

Mikrosoft sözcüsü, “Correction, küçük dil modelleri ve büyük dil modellerini yeni bir süreç kullanarak hizalayıcı belgelerle çıktıları hizalamak için kullanır.” dedi. “Bu yeni özelliğin, yanıtların doğruluğunun önemli bir önem kazandığı tıp gibi alanlarda generatif AI’nin geliştiricilere ve kullanıcılara destek olmasını umuyoruz.” şeklinde açıklama yaptı.

Google, bu yazın benzer bir özelliği Vertex AI adlı AI geliştirme platformunda sunarak müşterilere, üçüncü taraf sağlayıcıların verilerini, kendi veri setlerini veya Google Arama’yı kullanarak modelleri temellendirmelerine izin verir.

Ancak uzmanlar, bu temellendirme yaklaşımlarının yanılsamaların temel nedenini ele almadığı konusunda uyarıyorlar.

Washington Üniversitesi’nde yeni teknolojinin etik etkisini çalışan bir doktora adayı olan Os Keyes, “Generatif AI’dan yanılsamaları ortadan kaldırmaya çalışmak, su içindeki hidrojeni ortadan kaldırmaya çalışmak gibidir,” diyor. “Bu teknolojinin çalışma şeklinin temel bir bileşenidir.”

Mikrosoft’un Çözümü: Hatalı Bilgileri Düzeltme

Metin üreten modeller yanılsadıkları için aslında hiçbir şeyi “bilmemektedir”. Eğitildikleri sayısız örneğe dayanarak bir dizi kelimeyi tanımlayan ve hangi kelimelerin geleceğini tahmin eden istatistiksel sistemlerdir.

Bu nedenle, bir modelin yanıtları gerçek cevaplar değildir, sadece eğitim setinde bulunması durumunda bir sorunun nasıl yanıtlanacağını tahminlerdir. Sonuç olarak, modeller gerçekle hızlı ve gevşek oynamaktadır. Bir çalışma OpenAI’nın ChatGPT’nin tıbbi soruların yarısını yanlış yaptığını bulmuştur.

Mikrosoft’un çözümü, gerçekle uyuşmayan, uydurma veya ilgisiz metin parçalarını (yanılsamalar) bulan bir sınıflandırma modelidir. Yanılsamaları algıladığında, sınıflandırıcı ikinci bir modeli, belirtilen “temellendirme belgeleri” doğrultusunda yanılsamaları düzeltmek için devreye sokar.

Microsoft Correction — **Image Credits:**Microsoft

Mikrosoft sözcüsü, “Correction, generatif AI tarafından oluşturulan içeriğin güvenilirliğini ve güvenilirliğini önemli ölçüde artırabilir ve uygulama geliştiricilerin kullanıcı memnuniyetsizliği ve potansiyel itibar risklerini azaltmalarına yardımcı olabilir.” dedi. “Önemli bir nokta olan temellendirme algılama, ‘doğruluk’ sorununu çözmese de, generatif AI çıktılarını temellendirme belgeleriyle hizalamaya yardımcı olur.” şeklinde açıklama yaptı.

Keyes bunun konusunda şüpheleri olduğunu belirtti.

“Bazı sorunları azaltabilir,” diyor, “ancak yeni sorunlar da üretecektir. Sonuçta, Correction’ın yanılsama tespit kütüphanesi de yanılsama yapabilecek bir yeteneğe sahip olacaktır.”

Correction modelleri hakkında daha fazla bilgi için, sözcü, modellerin üretim öncesi mimarisini tanımlayan bir Microsoft araştırma ekibinin yeni bir makalesine işaret etti. Ancak makale, modelleri eğitmek için hangi veri kümesinin kullanıldığı gibi önemli detayları içermemektedir.

AI konusunda uzmanlaşmış Queen Mary Üniversitesi’nde bir araştırma görevlisi olan Mike Cook, Correction’ın pazarlama açısından da birçok soruna neden olabileceğini savunuyor. Özellik, tek başına ücretsiz olsa da Correction’ın görselleştirilmesi için gereken “temellendirme algılaması” aylık 5.000 “metin kaydı” için ücretsizdir. Bundan sonra 1.000 metin kaydı başına 38 cent maliyeti vardır.

Mikrosoft, şüphesiz olarak müşterilere – ve hissedarlarına – AI’nın yatırıma değer olduğunu kanıtlamak için baskı altında bulunuyor.

Yalnızca Q2’de, AI ile ilgili olarak başlıca sermaye harcamaları ve ekipman yatırımları dahil olmak üzere neredeyse 19 milyar dolara yönlendiren teknoloji devi. Ancak şirket, AI’dan henüz önemli bir gelir elde edemedi. Bu hafta bir Wall Street analisti, büyük ölçekli AI stratejisi konusundaki şüpheler nedeniyle şirketin hisse senedini düşürdü.

The Information’da bir makaleye göre, Microsoft’un öncü generatif AI platformu Microsoft 365 Copilot’un birçok erken benimseyicisi, performans ve maliyet endişeleri nedeniyle uygulamaları durdurmuştur. Microsoft Teams toplantıları için Copilot’u kullanan bir müşteri için AI’nın katılımcıları icat ettiği ve aslında hiç tartışılmayan konular üzerine çağrı olduğunu ima ettiği bildirilmiştir.

AI araçlarını pilot uygulamalarında hassasiyet ve yanılsama potansiyeli, bir KPMG anketine göre işletmelerin en büyük endişeleri arasında yer almaktadır.

Cook, mikrosoft’un Correction gibi bir hizmetin reklamcı yanını da ima ediyor. Özelliği tek başına ücretsizken, düzeltme yapabilmek için gereken “temellendirme algılama” aylık olarak ücretsiz şekilde 5.000 “metin kaydı”na kadar kullanılabilir. Bundan sonra 1.000 metin kaydı başına 38 cent maliyeti vardır.

Mikrosoft kesinlikle müşterilere – ve hissedarlara – AI’nın yatırıma değer olduğunu kanıtlamak için baskı altında bulunuyor.

Yalnızca 2. çeyrekte AI’ın yanı sıra başka alanlarda da önemli sermaye harcamaları ve ekipman yatırımları yapmasına rağmen şirket, AI’dan hala büyük bir gelir elde etmedi. Bu hafta, bir Wall Street analisti, şirketin hissesinin fiyatının düșmesi nedeniyle uzun vadeli AI stratejisi konusunda şüphelerini dile getirdi.

KPMG’nin bir anketine göre, hassasiyet ve yanılsama potansiyeli hinterlandında, işletmeler için en büyük endişeler arasında. Türkiye’de bu durum nasıl şekilleniyor. Wrold Message‘nın içeriklerine ulaşarak daha detaylı bilgilere ulaşabilirsiniz.