Finansal hizmetlerdeki dolandırıcılık, büyük bir sorun haline gelmiştir. 2023 yılı için yapılan bir tahmine göre, NASDAQ, bankaların ödemeler, çekler ve kredi kartı dolandırıcılığı sebebiyle 442 milyar dolar tutarında kayıpla karşılaşacağını belirtmektedir. Ancak mesele sadece maddi kayıplarla sınırlı değil. Dolandırıcılık, şirketlerin itibarını zedelerken, meşru alımların engellenmesi durumunda müşterileri de hayal kırıklığına uğratmaktadır. Bu duruma yanlış pozitif denir. Ne yazık ki, bu tür hatalar düşündüğünüzden daha sık meydana gelmektedir çünkü geleneksel dolandırıcılık tespit yöntemleri, dolandırıcılığın giderek daha karmaşık hale gelmesine ayak uyduramamaktadır.
Bu yazıda, finansal dolandırıcılığın en yaygın biçimlerinden biri olan kredi kartı dolandırıcılığına odaklanılacaktır. Kimlik hırsızlığı, hesap ele geçirme ve kara para aklama gibi diğer dolandırıcılık türleri de önemli endişeler arz etmekteken, kredi kartı dolandırıcılığı, yüksek işlem hacmi ve geniş saldırı yüzeyi nedeniyle dolandırıcılar için özel bir zorluk teşkil etmektedir. Nilson’a göre, finansal kurumların 2026 yılı itibarıyla yıllık kredi kartı kayıplarından 43 milyar dolar kaybetmesi beklenmektedir.
Geleneksel dolandırıcılık tespit yöntemleri, kural tabanlı sistemlerin veya istatistiksel yöntemlerin kullanılmasına dayalıdır ve giderek daha fazla karmaşık hale gelen dolandırıcılık faaliyetlerini tanımlamada etkisizleşmektedir. Veri hacimlerinin artması ve dolandırıcılık taktiklerinin evrim geçirmesiyle birlikte, finansal kuruluşların dolandırıcı işlemleri tespit etmek ve önlemek için daha proaktif ve akıllı yöntemlere ihtiyacı bulunmaktadır.
Yapay zeka (YZ), büyük miktarlardaki işlem verisini analiz etmek, anormal davranışları belirlemek ve dolandırıcılığı işaret eden kalıpları tanımak için gerekli araçları sunmaktadır. Ancak tespiti geliştirmek için atılan adımlara rağmen, yanlış pozitifleri azaltmak ve dolandırıcılık tespitinde operasyonel verimliliği artırmak için daha gelişmiş tekniklere ihtiyaç duyulmaktadır.
Dolandırıcılık Tespitinde Grafik Sinir Ağları
Geleneksel makine öğrenimi (MÖ) modelleri, XGBoost gibi, dolandırıcılık tespitinde yaygın bir şekilde kullanılmakta ve bireysel işlemlerde anormal davranışları tanımlamada etkili olduğu kanıtlanmıştır. Ancak dolandırıcılık tespiti, nadiren izole olayların bir sorunudur. Dolandırıcılar, genellikle hesaplar ve işlemler arasındaki bağlantıları kullanarak faaliyetlerini gizlemektedir. İşte burada grafik sinir ağları (GNN’ler) devreye girmektedir.
GNN’ler, grafik yapılandırmalı verilerle çalışacak şekilde tasarlanmıştır ve bu nedenle finansal hizmetlerde dolandırıcılık tespiti için özellikle uygundur. Her bir hesabı, işlemi ve cihazı bir ağ içindeki düğüm olarak düşünün. GNN’ler yalnızca bireysel işlemleri analiz etmekle kalmaz, aynı zamanda bu düğümler arasındaki bağlantıları değerlendirebilir. Bu sayede, ağdaki şüpheli etkinliklerin kalıplarını ortaya çıkarabilir.
Örneğin, diyelim ki bir hesap, bilinen dolandırıcılıkla ilişkili varlıklarla bağlantılıdır veya diğer yüksek riskli varlıklara benziyorsa, GNN’ler bu bağlantıyı tespit edebilir ve inceleme için işaretleyebilir. GNN’lerin XGBoost ile birleştirilmesi, her iki dünyanın en iyisini sunmaktadır:
- Daha yüksek doğruluk: GNN’ler yalnızca bireysel işlemlere odaklanmakla kalmaz, her şeyin nasıl bağlantılı olduğunu göz önünde bulundurarak, başka türlü tespit edilemeyen dolandırıcılığı yakalayabilir.
- Daha az yanlış pozitif: Daha fazla bağlam ile GNN’ler yanlış alarmları azaltmaya yardımcı olur; böylece meşru işlemler gereksiz yere işaretlenmez.
- Daha iyi ölçeklenebilirlik: GNN’ler, büyük veri ağlarının verimli bir şekilde işlenmesini sağlar. Ancak GNN’lerin XGBoost ile gerçek zamanlı dolandırıcılık tespiti (çıkarım) geniş ölçeklerde bile mümkündür.
- Açıklanabilirlik: GNN’lerin XGBoost ile birleşimi, derin öğrenmenin gücünü karar ağaçlarının açıklanabilirliği ile bir araya getirir.
GNN’ler Kullanarak Uçtan Uca Dolandırıcılık Tespit İA Süreci
NVIDIA, geleneksel MÖ ile GNN’lerin gücünü birleştiren bir uçtan uca dolandırıcılık tespit süreci geliştirmiştir. Bu süreç, standart bir XGBoost yaklaşımını temel alır, ancak onu GNN gömme özellikleriyle zenginleştirerek doğruluğu önemli ölçüde arttırır. Kesin sayıların gizli olduğu belirtilmiştir, ancak yalnızca %1’lik bir iyileşmenin bile milyonlarca dolara mal olabileceği, GNN’lerin dolandırıcılık tespit sistemlerinin kritik bir parçası haline geldiğini göstermektedir.
Bu süreç, iki ana bölümden oluşmaktadır: model oluşturma adımı ve çıkarım süreci.
GNN’ler ve XGBoost ile Model Oluşturma
Proses, model oluşturma aşamasıyla başlamaktadır; çünkü bir model çıkarım için mevcut olmalıdır. Bu aşamada GNN’ler, bir XGBoost modeline (Şekil 2) beslenen özellikleri (gömme) oluşturmak için kullanılır.
Adım 1: Veri Hazırlama
Gelen işlem verileri temizlenip hazırlanır ve genellikle bu işlemler için etkinlik sağlayan RAPIDS gibi araçlar kullanılır. Veri hazırlama ve özellik mühendisliği, model oluşturmanın performansı üzerinde büyük bir etkiye sahiptir. Bu adım, verilerin detaylı bir şekilde anlaşılmasını gerektirir ve en iyi sonuçları elde etmek için birkaç deneme yapmayı gerektirebilir.
Bir veri hazırlama scripti oluşturulduktan sonra, bu işlem iş akışında otomatikleştirilebilir. Veri hazırlama süreci, yeni veriler eklendikçe veya veri büyüdükçe değerlendirilmelidir. Bir sonraki aşamada, NVIDIA RAPIDS Accelerator for Apache Spark kullanılarak bu iş akışının veri işleme kısmı hızlandırılacaktır.
Adım 2: Grafik Oluşturma
Büyük veri kümesi için, Finansal Hizmetler Sektörü (FHS)‘ne özgü veriler, hazırlanmış verilerin özellik deposuna (tablo verisi) ve grafik deposuna (yapısal veri) dönüştürülmesi sürecidir. Bu, ana bellek ve cihaz bellek kullanımı ile pik performansı daha iyi hale getirir. Bu iki depo, PyG (PyTorch Geometric) ve DGL (Deep Graph Library) gibi GNN çerçeveleri için optimize edilmiştir.
Adım 3: GNN Gömme Üretimi
GNN, bir sınıflandırma üretmek yerine, gömme özelliklerini çıkarmaktadır. Bu GNN gömmeleri, XGBoost’a geçilecek şekilde verilmekte ve model oluşturulmaktadır. Bu model, çıkarımda kullanılmak üzere kaydedilmektedir.
Bu iş akışı, GNN çerçevelerinin GPU hızlandırılmış versiyonları olan cuGraph-pyg ve cuGraph-dgl kullanarak büyük veri setleriyle karmaşık grafik yapılarını etkin bir şekilde yönetebilmektedir.
Gerçek Zamanlı Dolandırıcılık Tespiti için Çıkarım
Model eğitildikten sonra, gerçek zamanlı dolandırıcılık tespiti için NVIDIA Triton Inference Server kullanılarak hizmet edilebilir. Bu açık kaynaklı AI model sunma platformu, AI çıkarım yüklerini üretime akıcı ve hızlandırılmış bir şekilde dağıtmada yardımcı olur. NVIDIA Triton, işletmelere model sunma altyapısının karmaşıklığını azaltma, yeni AI modellerini üretime alma süresini kısaltma ve AI çıkarım ve tahmin kapasitesini artırma sağlar.
Ayrıca eğitilen model, büyük miktarlardaki akış verilerinin filtrelenmesi, işlenmesi ve sınıflandırılması için optimize edilmiş uygulamalar geliştirmeye olanak tanıyan açık kaynaklı bir siber güvenlik AI çerçevesi olan NVIDIA Morpheus kullanılarak dağıtılabilir. Morpheus Runtime Core (MRC), bu iş akışını düzenleyerek büyük veri işleme ve analizini hızlandırmakta ve periyodik olarak yeni bir model oluşturma sürecini tetiklemektedir.
Çıkarım süreci, aşağıdaki adımları içermektedir:
- Ham girdi verilerinin, model oluşturma (eğitim) aşamasında kullanılan süreçle aynı yöntemle dönüştürülmesi.
- Verilerin GNN modeline verilerek işlemin bir gömme haline dönüştürülmesi. Bu gereklidir çünkü XGBoost modeli gömme üzerinde eğitilmiştir.
- Gömme verilerinin, işlemlerin dolandırıcılık olup olmadığını tahmin etmek için XGBoost modeline verilmesi.
Dolandırıcılık Tespitini Geliştirmek için İA Ekosistemi
Amazon Web Services (AWS), bu uçtan uca dolandırıcılık tespit iş akışını kendi yüksek güvenlikli hızlandırılmış hesaplama yetenekleriyle entegre eden ilk bulut hizmet sağlayıcısıdır. Bu basit iş akış entegrasyonu ile dolandırıcılık tespit modelleri oluşturan geliştiriciler, veri işleme için Amazon EMR içinde NVIDIA RAPIDS kullanabilir ve model eğitimi için Amazon SageMaker ve Amazon EC2 hizmetlerinde RAPIDS ve GNN kütüphanelerinden yararlanabilir. Ayrıca, NVIDIA Morpheus ve NVIDIA Triton Inference Server aracılığıyla Amazon SageMaker veya Amazon Elastic Kubernetes Service’de düşük gecikmeli ve yüksek hızda tahminleri esnek bir şekilde ölçeklendirebilirler.
Bu çabalar devam ederken, bu iş akışının NVIDIA ortak ekosisteminde, işletmelerin ve geliştiricilerin prototip oluşturup bunu üretime geçirebileceği şekilde NVIDIA AI Enterprise aracılığıyla erişilebilir olması planlanmaktadır.
Başlamak için
Dolandırıcılık taktikleri evrim geçirdikçe, geleneksel tespit yöntemleri yetersiz kalmaktadır. XGBoost ile GNN’lerin birleştirilmesi, doğruluğu artıran, yanlış pozitifleri azaltan ve gerçek zamanlı tespiti geliştiren güçlü bir çözüm sunar. Bu Yapay Zeka iş akışı, işletmelerin karmaşık dolandırıcılık girişimlerine karşı önde kalmasına ve yeni tehditlere hızla adapte olmasına yardımcı olmak için tasarlanmıştır.
Daha fazla bilgi edinmek için GNN’leri dolandırıcılık tespitine entegre etme konusundaki AI Kredi Kartı Dolandırıcılığı İş Akışına göz atabilirsiniz. Ayrıca, NVIDIA LaunchPad laboratuvarını XGBoost Modelini NVIDIA Triton kullanarak dağıtma ve Dolandırıcılık Tespiti için Yapay Zeka Kullanım Durumu üzerinde de keşif yapabilirsiniz.