model seçim kriterleri: beş boyut
Model seçimi asla tek boyutlu bir optimizasyon değildir. AUC'unu maksimize etmek, diğer kısıtları görmezden gelmek anlamına gelir. Pratik model seçimini belirleyen beş boyut:
Düzenleyici uyum: IRB modelleri için yorumlanabilirlik zorunlu. Model çıktısının "müşteriye açıklanabilir ve denetlenebilir" olması gerekir. GBM/NN bu standardı karşılamaz.
Veri boyutu: n < 1.000'de lojistik regresyon GBM'i geçer. Karmaşık model küçük veride variance'tan boğulur. Feature sayısı yüksekse regularizasyon kritik.
İlişki karmaşıklığı: Özellikler arasında yüksek-düzey etkileşimler var mı? Yoksa lineer ilişkiler hakim mi? Ikincisinde basit model yeterlidir.
Deployment kısıtları: Gerçek zamanlı tahmin mi, toplu işlem mi? Bellek, gecikme, yeniden eğitim sıklığı?
İzleme yeteneği: Derin modeller drifti daha zor sinyaller verir. Logistic regression katsayı izleme, GBM'de anlamlı olmaz.
artifact — model yorumlanabilirlik & performans haritası
Her model tipi yorumlanabilirlik (X ekseni) ve diskriminasyon gücü (Y ekseni) açısından konumlandırıldı. Bir kullanım amacı seçin — o amaca uygun bölge vurgulanır, önerilen modeller parlak görünür.
bankacılıkta model türü ve kullanım alanı
| Model Türü | IRB PD/LGD | Fraud | IFRS 9 | Behavioral | Erken Uyarı |
|---|---|---|---|---|---|
| Logistik Regresyon | ✓ Birincil | ◦ Temel | ✓ Birincil | ◦ OK | ◦ OK |
| WoE Scorecard | ✓ Birincil | ◦ Sınırlı | ✓ Birincil | ◦ OK | ◦ OK |
| Karar Ağacı (sığ) | ◦ Destekleyici | ◦ Sınırlı | ◦ Destekleyici | ◦ OK | ✓ OK |
| Random Forest / GBM | ✗ Uygun değil | ✓ Birincil | ✗ Risk | ✓ Birincil | ✓ Birincil |
| Sinir Ağı / Deep | ✗ Uygun değil | ✓ Yüksek perf. | ✗ Risk | ◦ Özel durum | ✗ Çok karmaşık |
tipik hata
İkinci yanılgı: model seçimini veri bilimciye bırakmak. Model seçimi teknik değil, stratejik bir karardır: kullanım amacı, regülatör ilişkisi, model risk iştahı ve uzun vadeli bakım maliyeti dahil. Veri bilimci teknik boyutu, model risk ve iş birimleri strateji boyutunu birlikte değerlendirmelidir.