Veri Bilimi & Modelleme
Veri Bilimi Yol Haritası
Kod yazmayı değil, veriyle düşünmeyi öğretmek için. Kredi riski, model validasyonu ve karar sistemleri dünyasına analitik bir bakış açısıyla giriş — analistten model düşünürüne. Her bölüm güncel regülasyon (Basel/CRR3, EBA, IFRS 9, SR 11-7, BDDK) zeminine bağlanır.
34
interaktif bölüm
XII
katman
40+
interaktif görsel
Bu yol haritası bir bootcamp müfredatı değildir. Python, pandas veya sklearn listesi yoktur. Amaç, modeli anlamak, sorgulamak ve risklerini görmek için gereken zihinsel mimariyi kurmaktır. Sıra önemlidir — her katman bir öncekinin eksikliğinden doğan yeni bir sorudur. PD/LGD/EAD validasyonunda çalışan biri için büyük resmi ve işin temel mantığını oturtur.
katman IVeri Okuryazarlığı & Ölçüm Düşüncesi
"Veri nedir, ne değildir?"
Her şeyin başladığı yer. Veriyi "verili" değil, "üretilmiş" görmek bu katmanın tek hedefidir.
01
Veri Nedir, Ne Değildir?
Veri, gerçekliğin değil ölçtüğümüzün izidir. Reddedilen müşteri, kayıp event, gözlenemeyen kullanıcı verinin dışındadır. Reject Inference Lens + MoC şelalesiyle eğitim setinin kör noktası ve sermaye etkisi.
→
02
Ölçüm Düşüncesi & Operasyonel Tanım
"Temerrüt nedir?" felsefi değil matematikseldir. CRR Md.178 anatomisi, materiality eşiği ve 90-gün sayacı interaktifi: tanım değişince bad rate ve model nasıl değişir?
→
03
Veri Türleri, Granülarite & Zaman Boyutu
Snapshot mı panel mi? PIT mi TTC mi? Observation/performance window ve look-ahead bias. Zamanı yanlış kesmek modeli çürütür. Window Configurator.
→
katman IITanımlayıcı İstatistik & Dağılım Sezgisi
"Verinin sesi nasıl dinlenir?"
Ortalama görmekten dağılım okumaya geçiş. Tek sayı her zaman yanlış anlatır.
04
Ortalama Yalan Söyler: Merkez & Yayılım
Sermaye ortalamanın değil yayılımın fiyatıdır: Basel beklenmeyen kayba (kuyruğa) kurulur. Mean Trap Simulator ile ortalama-medyan ayrışması.
→
05
Dağılım Aileleri & Bankada Karşılığı
Gelir neden log-normal, LGD neden beta, temerrüt süresi neden exponential? Kalın kuyruk, downturn LGD ve FRTB. Distribution Explorer.
→
06
Aykırı Değer ile Sinyal Farkı
Fraud'da aykırı değer kötü veri değil, iyi sinyaldir. Gerekçesiz outlier silme veri kalitesi kusuru → MoC. Ne zaman temizle, ne zaman koru?
→
katman IIIOlasılık & Belirsizlik Sezgisi
"Belirsizlik nasıl ölçülür?"
Dağılımları gördük; ama bir sonraki noktayı söyleyebiliyor muyuz? Belirsizliği matematikselleştirmek bu katmanın işi.
07
Olasılık Nedir? Frequentist vs Bayesian
"%5 PD" ne demek? IRB uzun-dönem PD frequentist; düşük temerrütlü portföyde Bayesian + MoC. İki okulun farkı validasyonda neden kritik? Bayesian Updater.
→
08
Koşullu Olasılık & Bayes Refleksi
P(temerrüt | düşük gelir) ≠ P(düşük gelir | temerrüt). Taban oranı yanılsaması ve PPV. Bu refleks oturmadan validasyon imkânsız. Conditional Probability Console.
→
09
Beklenen Değer, Risk & Bileşik Olaylar
Bankacılığın motoru: EL = PD × LGD × EAD. ASRF, varlık korelasyonu ve EL→karşılık / UL→sermaye ayrımı. Portföy korelasyon simülatörü.
→
katman IVÖrnekleme, Bias & Çıkarım
"Parça hakkında bütüne ne söylenebilir?"
Elimizdeki veri popülasyonun tamamı değil. Örneklemden popülasyona geçişin disiplin gerektirdiğini öğren.
10
Popülasyon, Örneklem & Çıkarım
Eğitim verisi gelecekteki müşteri tabanını temsil ediyor mu? IRB'de "representative" koşulu (CRR Md.174–179) ve OOT'nin gerekçesi.
→
11
Bias Atlası: Görünmez Sapmalar
Selection, survivorship, look-ahead, temporal bias. Hepsi banka modellerinde sessizce öldüren sapmalar. Her birini tanı ve nasıl sızdığını gör.
→
12
Hipotez Testi & Belirsizlik Dili
Değişken anlamlı mı? Tip 1 / Tip 2 hata, p-value, güven aralığı. PD backtesting'in dili: Jeffreys testi ve traffic-light.
→
katman Vİlişki, Nedensellik & Feature Düşüncesi
"Birlikte değişmek aynı sebepten mi gelir?"
Korelasyon görmek kolaydır; sebep-sonuç ilişkisine emin olmak çok daha zordur.
13
Korelasyon ≠ Nedensellik
Limit artışı temerrüdü "azaltıyor" gibi görünebilir — aslında selection effect. Confounder, mediator, collider. EBA'nın ekonomik anlamlılık şartı.
→
14
Feature Engineering, WoE/IV & DGP
Veriyi üreten süreci anlamadan feature üretmek körü körüne kürektir. WoE/IV bu felsefenin yasal modeldeki dili; IV eşikleri ve monotonluk.
→
katman VIModel Dilinin Temeli
"Model gerçekliği nasıl konuşur?"
İlk model dili: regresyon ailesi. Her karmaşık model, bu dilin varsayım ihlallerine verilen yanıttır.
15
Supervised Learning Zihinsel Modeli
y = f(x) + ε. Bu denklemi anlamayan modelin neyi öğrendiğini de anlayamaz. ε neden AUC=1'i imkânsız kılar — ve neden "çok iyi" model leakage şüphesidir?
→
16
Lineer Regresyon: İlk Model Dili
Her karmaşık model OLS varsayım ihlaline verilen yanıttır. Stres testi satellite modellerinin dili. Regression Playground + Residual Viewer.
→
17
Lojistik Regresyon & Maximum Likelihood
Olasılığı (−∞, +∞) eksenine çevirmek. Sigmoid, MLE ve Wald anlamlılığı. Yasal PD modelinin fiili standardı. Logistic Curve Slider.
→
katman VIISınıflandırma, Skor & Eşik
"Olasılığı karara nasıl çeviririz?"
Modelin çıktısı sayıdır. Kararı insan verir. Bu iki katmanın karıştırılması modellemenin en yaygın hatasıdır.
18
Skor, Olasılık, Karar: Üç Farklı Katman
Skor = sıralama, olasılık = kalibrasyon, karar = eşik. CRR derecelendirme ölçeği ve use test. Üçünü karıştırmak en yaygın hatadır.
→
19
ROC, AUC & KS: Ayırt Edicilik Ölçümü
Bu metriklerin hepsi sıralama başarısını ölçer — kalibrasyonu değil. AUC 0.85 iyi mi? AUC > 0.95 leakage işareti. ROC/AUC + KS Visualizer.
→
20
Kalibrasyon & Cut-off Optimizasyonu
PD %5 dediğinde gerçekten %5 mi batıyor? AUC iyi, kalibrasyon bozuk olabilir. Long-run average, Jeffreys, Hosmer-Lemeshow. Threshold Console.
→
katman VIIIPerformans, Genelleme & Validasyon
"Modelin dürüstlüğü nasıl ölçülür?"
İyi skor ezberleme işareti olabilir. Genelleme, modeli yaratan değil; modeliyle yüzleşen birinin sorusudur.
21
Overfitting, Genelleme & Bias-Variance
Veri sızıntısı en sık ezberle geçilen prensip. Train/Validation/Test disiplini, OOT'nin zorunluluğu ve bias-variance dengesi.
→
22
Cross-Validation & Model Seçim Çerçevesi
Banka verisinde zamanı yok saymak ölümcüldür. K-fold ne zaman yanlış? Walk-forward CV, L1/L2 düzenlileştirme ve MoC Kategori C.
→
23
PSI, Popülasyon Stabilitesi & Drift
Model kötüleşmeden önce veri kötüleşir. PSI eşikleri (0.10 / 0.25), yeniden kalibrasyon mı yeniden kurulum mu? Yıllık validasyon beklentisi.
→
katman IXNonlineer Dünya: Ağaçlar & Ensemble
"Karmaşık örüntü nasıl öğrenilir?"
Lineer dünya yetmiyor. Ağaçlar farklı bir öğrenme dili — bireysel değil, kolektif akıl.
24
Karar Ağaçları & Ensemble Sezgisi
Ağaç nasıl soru sorar? Information gain, Gini, entropy. Bagging ve kolektif akıl. Yasal dünyada meşru rol: segmentasyon. Decision Tree Splitter.
→
25
Gradient Boosting & Regularizasyon
Ardışık ağaçlar önceki modelin hatasını öğrenir. XGBoost/LightGBM, early stopping. Yönetsel/challenger modellerin fiili standardı — ama IRB'de değil.
→
26
Yorumlanabilirlik: SHAP, PDP & Model Açıklaması
SHAP yasal model değişken seçiminde neden hatalı, kara-kutu açıklamasında neden değerli? Adverse action, EU AI Act ve GDPR şeffaflık. SHAP Storyboard.
→
katman XYorumlanabilirlik vs Tahmin Gücü
"Hangi modelde, hangi tarafa eğiliriz?"
Bu roadmap'in en kritik gerilimi. Teknik tercih değil; yönetişimsel karar. Validatör burada durmak zorundadır.
27
Model Seçim Stratejisi: Doğruluk vs Yorumlanabilirlik
Neden IRB logit, neden davranışsal skorlama XGBoost? İki dünya: yasal (onaya tabi) vs yönetsel. Teknik değil, yönetişimsel bir karar.
→
28
Nedensel Çıkarım & A/B Testi
Limit artışı temerrüdü gerçekten azalttı mı, yoksa selection mı? DiD, paralel trend ve A/B testi. Politika etkisini izole etmek. Champion/challenger.
→
29
Fairness, Bias & Etik AI
Korunan özniteliği çıkarmak yetmez; proxy üzerinden dolaylı ayrımcılık. Disparate impact, EU AI Act (yüksek-risk), GDPR Md.22, adil kredi.
→
katman XIZaman, Drift & Monitoring
"Model neden yaşlanır?"
Model bugün iyi çalışıyor. Yarın? Model biyolojik bir varlık gibidir — doğar, gelişir, yaşlanır.
30
Vintage Analizi & Survival Sezgisi
Temerrüde-kadar-süre modellenince IFRS 9 lifetime PD ve PD vade yapısı doğar. Kaplan-Meier, hazard, censoring. Vintage eğrileri origination drift'i gösterir.
→
31
Model İzleme & Erken Uyarı Sistemi
Ne, ne sıklıkla, hangi eşikle izlenir? CRR yıllık gözden geçirme, traffic-light, eskalasyon protokolü. Monitoring Control Panel.
→
32
Stres Testi & Senaryo Analizi
ICAAP/SREP, EBA/ECB stres testi, ters stres testi. Makro-PD (uydu) modelleri ve overlay'ler. IFRS 9 çoklu senaryo ağırlıklandırma.
→
katman XIIKarar, İşletme & Yönetişim
"Tahminden kurumsal karara nasıl geçilir?"
Modeli matematiksel değil, kurumsal varlık olarak görmek. Validasyon disiplini bütün katmanların üst soyutlamasıdır.
33
Model Yönetişimi: Lifecycle & Onay
Skor karar vermez; yönetir. Model lifecycle, risk derecelendirme, onay. SR 11-7 ve üç savunma hattı; model envanteri.
→
34
Birleştirici Çerçeve: Veri Bilimciden Model Risk Uzmanına
Bu bölüm özet değil; bir bakış açısıdır. 12 katmanın validasyon diline çevirisi ve tek sayfalık düzenleyici çerçeve haritası.
→
Her bölüm bağımsız bir interaktif modüldür. Slider, canvas ve görsel artifact içerir. Önerilen sırayı takip edin — her katman bir öncekinin eksikliğinden doğan yeni bir sorudur.