Model Seçim Stratejisi · Veri Bilimi Yol Haritasi

Katman X · Yorumlanabilirlik vs Tahmin Gücü · 27 / 29

Model Seçim Stratejisi: Doğruluk vs Yorumlanabilirlik

bu bölümün sorusu

"XGBoost her zaman daha iyidir" mi? Hayır. Soru "en iyi AUC hangi modelde?" değil, "bu kullanım amacı için doğru model hangisi?" — ve bu soru teknik olduğu kadar yönetişimsel bir sorudur.

model seçim kriterleri: beş boyut

Model seçimi asla tek boyutlu bir optimizasyon değildir. AUC'unu maksimize etmek, diğer kısıtları görmezden gelmek anlamına gelir. Pratik model seçimini belirleyen beş boyut:

Düzenleyici uyum: IRB modelleri için yorumlanabilirlik zorunlu. Model çıktısının "müşteriye açıklanabilir ve denetlenebilir" olması gerekir. GBM/NN bu standardı karşılamaz.

Veri boyutu: n < 1.000'de lojistik regresyon GBM'i geçer. Karmaşık model küçük veride variance'tan boğulur. Feature sayısı yüksekse regularizasyon kritik.

İlişki karmaşıklığı: Özellikler arasında yüksek-düzey etkileşimler var mı? Yoksa lineer ilişkiler hakim mi? Ikincisinde basit model yeterlidir.

Deployment kısıtları: Gerçek zamanlı tahmin mi, toplu işlem mi? Bellek, gecikme, yeniden eğitim sıklığı?

İzleme yeteneği: Derin modeller drifti daha zor sinyaller verir. Logistic regression katsayı izleme, GBM'de anlamlı olmaz.

No Free Lunch teoremi: herhangi bir öğrenme algoritması, tüm problem dağılımları üzerinde ortalaması alındığında eşit derecede iyi (veya kötü) performans gösterir. "En iyi model" her zaman bağlama özgüdür.

artifact — model yorumlanabilirlik & performans haritası

Her model tipi yorumlanabilirlik (X ekseni) ve diskriminasyon gücü (Y ekseni) açısından konumlandırıldı. Bir kullanım amacı seçin — o amaca uygun bölge vurgulanır, önerilen modeller parlak görünür.

interactive — model yorumlanabilirlik & performans haritası

katman X · bölüm 27

Kullanım amacı:

Model baloncukların boyutu model karmaşıklığını temsil eder. X ekseni yüksek = yorumlanabilir; Y ekseni yüksek = güçlü diskriminasyon.

Bankacılıkta iki farklı dünya: regülatör uyumlu modeller (IRB, IFRS 9) ve operasyonel modeller (fraud, collections, behavioral). İki dünya farklı kısıtlara sahip. Bir ML mühendisinin "en iyi" dediği model, IRB dokümanında yer alamaz.

bankacılıkta model türü ve kullanım alanı

Model Türü	IRB PD/LGD	Fraud	IFRS 9	Behavioral	Erken Uyarı
Logistik Regresyon	✓ Birincil	◦ Temel	✓ Birincil	◦ OK	◦ OK
WoE Scorecard	✓ Birincil	◦ Sınırlı	✓ Birincil	◦ OK	◦ OK
Karar Ağacı (sığ)	◦ Destekleyici	◦ Sınırlı	◦ Destekleyici	◦ OK	✓ OK
Random Forest / GBM	✗ Uygun değil	✓ Birincil	✗ Risk	✓ Birincil	✓ Birincil
Sinir Ağı / Deep	✗ Uygun değil	✓ Yüksek perf.	✗ Risk	◦ Özel durum	✗ Çok karmaşık

Hibrit yaklaşım: Bazı bankalar IRB için yorumlanabilir "backbone" model kullanır, üzerine GBM tabanlı "overlay" katar. Overlay regülatörle önceden onaylanmış ise kabul edilebilir. Ama overlay'in katkısını ve yorumunu dokümante etmek zorunludur — aksi takdirde model riski onay sürecinde takılır.

tipik hata

Yaygın yanılgı: "Yorumlanabilir model seçmek performanstan taviz vermektir." Çoğu bankacılık uygulamasında bu yanlış. WoE scorecard + lojistik regresyon, iyi feature engineering ile GBM'e oldukça yakın AUC üretir. Fark genellikle 0.02-0.05 AUC — regülatör uyum maliyetiyle kıyaslandığında makul bir bedel bile değil.

İkinci yanılgı: model seçimini veri bilimciye bırakmak. Model seçimi teknik değil, stratejik bir karardır: kullanım amacı, regülatör ilişkisi, model risk iştahı ve uzun vadeli bakım maliyeti dahil. Veri bilimci teknik boyutu, model risk ve iş birimleri strateji boyutunu birlikte değerlendirmelidir.

Sıradaki adım: Zaman boyutuna giriyoruz — kredi modellerinde vintage analizi ve yaşam süresi tahminleri.

Sıradaki bölüm · Katman X · 28

Nedensel Çıkarım & A/B Testi

→