Katman IX · Nonlineer Dünya · 26 / 26
Yorumlanabilirlik: SHAP, PDP & Model Açıklaması
bu bölümün sorusu
Model "bu müşteriye %38 PD atıyorum" diyor. Neden? Hangi özellik ne kadar katkı yapıyor? Bu sorunun cevabı hem regülatör hem de müşteri için zorunlu — ve istatistiksel olarak titiz bir yanıt veren araç SHAP'tır.

SHAP: shapley değerleri ve katkı atfı

SHAP (SHapley Additive exPlanations), oyun teorisinden ödünç alınan Shapley değerlerine dayanır. Temel soru: "Her özellik, bu spesifik tahmin için portföy ortalamasından ne kadar sapma üretmektedir?" Cevap, her özellik için bir katkı değeridir (SHAP value) — pozitif ise PD'yi artırıyor, negatif ise düşürüyor.

Formülü özetle: tahmin = E[f(X)] + Σ φᵢ — portföy ortalama PD'si artı her özelliğin katkıları toplamı. Bu additif yapı, SHAP'ı hem matematiksel olarak doğru hem de açıklanabilir kılar. Tek bir müşteri için "gecikme sayısı PD'yi %11.5 artırdı" cümlesi tam anlamıyla ifade edilebilir.

SHAP, modelin ne düşündüğünü söyler — ama neden öyle düşündüğünü değil. Yorumlama gücü gerçektir; nedensel çıkarım iddiası ise değildir. Gecikme sayısının PD'yi artırması, gecikmenin temerrüdü "neden olduğu" anlamına gelmez.

artifact — SHAP waterfall görselleştirici

Üç farklı müşteri profili. Her biri için portföy ortalamasından (%8.5) başlayarak her özelliğin PD'ye katkısı kümülatif olarak gösteriliyor. Coral çubuklar riski artırıyor, teal çubuklar riski azaltıyor.

interactive — SHAP waterfall görselleştirici
katman IX · bölüm 26
Müşteri profili:
Portföy Ort. PD
%8.5
E[f(X)] — baz değer
Tahmin PD
En Büyük Faktör
Risk Sınıfı
PD eşiğine göre
Waterfall grafiği, "siyah kutu" modelinin bile bireysel tahminler için şeffaf bir özet sunmasını sağlar. GDPR Madde 22 kapsamında kredi kararları için müşteriye açıklama yükümlülüğü bu tür çıktılara dayanır. Ancak dikkat: SHAP değeri, modelin kararını açıklar — temerrüt olayını değil.

global yorumlanabilirlik araçları

SHAP, tek bir tahmin için çalışır (lokal). Tüm portföy genelinde model davranışını anlamak için ise global araçlar kullanılır.

Feature Importance (Safsızlık Bazlı)
Her değişkenin tüm ağaçlarda ortalama Gini azalmasına katkısı. Hızlı ama korelasyonlu değişkenler arasında önemi keyfi dağıtır. Validasyonda değişken seçimi için yetersiz — sadece model davranışını yansıtır.
Permutation Importance
Bir değişken rastgele karıştırılınca model performansı ne kadar düşüyor? Safsızlık bazlısından daha güvenilir. Ancak korelasyonlu değişkenler karıştırılınca diğeri "devreye girer" — etki hafife alınır.
PDP (Kısmi Bağımlılık Grafiği)
Bir değişken belirli bir değer alırken tüm diğer değişkenler sabit tutulduğunda ortalama model çıktısı nedir? DTI = %80 olduğunda ortalama PD kaçtır? Non-lineer ilişkileri gösterir. Aykırı değerlerden etkilenir.
SHAP Summary Plot
Tüm veri noktaları için SHAP değerleri bir arada gösterilir: özellik önemine göre sıralanmış, her nokta renklendirilmiş (feature değeri yüksek mi düşük mü?). Hem önem hem yön bilgisini aynı anda verir.
SHAP'ın bankacılık validasyonundaki sınırları: (1) SHAP değişken seçim kriteri olarak kullanılamaz — korelasyonlu değişkenler SHAP'ı paylaşır. (2) SHAP model davranışını açıklar, verinin gerçek nedensel yapısını değil. (3) IRB modeli logistic regression'daysa SHAP'a gerek yok — katsayılar zaten yorumlanabilir. SHAP, kara kutu modelleri için bir yama; doğrudan yorumlanabilir modeller için gereksizdir.

tipik hata

Yaygın yanılgı: "SHAP değeri yüksek = o değişken önemli = onu policy olarak kullanabiliriz." SHAP, modelin öğrendiği korelasyonu yansıtır. DTI'ın yüksek SHAP'ı, DTI azaltılırsa temerrüdün azalacağını garanti etmez — ortak bir nedenin (gelir kaybı) her ikisini de etkiliyor olabilir. Policy kararları için nedensel çerçeve gerekir, SHAP değil.

İkinci yanılgı: yorumlanabilirliği doğrulukla değiş tokuş yapmak zorunlu sanmak. Logistic regression + WoE, iyi tasarlanmış feature seti ile güçlü bir GBM'e yakın AUC üretebilir — ve tam yorumlanabilir kalır. Yorumlanabilirlik-doğruluk tradeoff'u çoğu zaman feature engineering kalitesiyle ilgilidir, algoritma seçimiyle değil.

Katman IX tamamlandı. Ağaçlar, GBM ve SHAP — nonlineer dünyanın araçlarını öğrendik. Katman X'da zaman, drift ve monitoring başlıyor.
Sıradaki bölüm · Katman X · 27
Model Seçimi