Katman I · Veri Okuryazarlığı · 03 / 03
Veri Türleri, Granülarite & Zaman Boyutu
bu bölümün sorusu
Aynı müşteri, farklı bir zaman penceresinden izlenirse farklı bir model nesnesi olur. Zaman, verinin tanımlanmayan ama her şeyi belirleyen üçüncü boyutudur.
zamanin önemi: üç temel boyut
Kredi modelleri zaman içinde var olan nesneleri ölçer. Müşterinin bugünkü davranışı ile 18 ay önceki davranışı farklı sinyaller taşır. Hangi noktadan baktığın, kaç aylık geçmişi kullandığın ve sonucu ne kadar ileri pencerede aradığın — bunların hepsi modelin öğrendiğini şekillendirir.
Bankalarda bu sorun üç kavramda cristalleşir: observation window (değişkenleri ne zaman okudun), performance window (sonucu ne zaman gözledin) ve ikisi arasındaki gap. Bu üçünü yanlış kesmek, modeli teknik olarak çalışır ama anlamsız hale getirir.
snapshot
Tek bir tarihteki kesit. "15 Mart itibariyle müşteri bilgileri." Geçmişi ve dinamiği görmez.
panel veri
Aynı müşterinin zaman içindeki birden fazla gözlemi. Davranışsal değişimi ve mevsimselliği yakalar.
referans tarihi
Modelin "bugün" olarak kabul ettiği an. Observation ve performance window'ların çıkış noktası.
Özellikle dikkat edilmesi gereken kavram: look-ahead bias. Modelin tahmin yaparken kullandığı değişkenlerin, gelecekte gerçekleşecek olaylardan etkilenmiş olması demektir. Referans tarihinden sonraki bilgilerin gözlem penceresine sızması modeli gerçek hayatta işe yaramaz kılar — ama eğitim metriklerini parlak gösterir.
observation window neden önemli?
Çok kısa tutulursa müşteri davranışının mevsimselliği ve döngüsü kaçırılır. Çok uzun tutulursa çok eski ve artık geçersiz bilgi modele girer.
performance window neden önemli?
Çok kısa tutulursa henüz gerçekleşmemiş temerrütler "iyi" sayılır. Çok uzun tutulursa farklı ekonomik dönemlerdeki davranışlar karışır.
Zaman, verinin gizli bir değişkenidir. X ve Y değişkenleri kadar kritik — ama çoğu zaman sessizce tanımlanır ya da hiç tanımlanmaz.
artifact — observation & performance window configurator
Kaydırıcılarla üç zaman penceresini yapılandırın. Observation ve performance window'ların birbirine nasıl oturduğunu, gap sıfıra indiğinde ne olduğunu görün.
performans penceresi
12 ay
Yapılandırma dengeli görünüyor. Gözlem ve performans pencereleri arasında 1 aylık gap var — bilgi sızıntısı riski düşük.
Bazı bankalarda gözlem ve performans pencereleri arasındaki gap'i "seasoning period" olarak da tanımlarlar. Bu süre, tahmin anının hemen sonrasındaki kısa dalgalanmaların performans penceresini kirletmesini önler.
point-in-time vs through-the-cycle
Kredi modelleri için zamanın ikinci önemli boyutu: PD tahmininin ekonomik döngüyle olan ilişkisi. Aynı müşteri için, aynı model, iki farklı "zaman felsefesi" altında çok farklı PD üretir.
Point-in-Time (PIT) yaklaşım, modeli anlık ekonomik koşullara duyarlı tutar. Resesyonda PD yükselir, ekonomik genişlemede düşer — bu gerçekçidir ama oyucudur. Through-the-Cycle (TTC) yaklaşım ise uzun vadeli ortalamayı hedefler; döngüsel değişimlerden bağımsız, stabil bir tahmin üretir.
Point-in-Time (PIT)
Ne yapar: Anlık ekonomik koşulları yansıtır. Makro değişkenlerle birlikte hareket eder.
Avantaj: Güncel risk seviyesini gerçekçi gösterir. Stres testi ve fiyatlama için doğal.
Dezavantaj: Döngüsel. Resesyonda yüksek karşılık → kötü dönemde ek baskı yaratır.
IFRS 9 · stres testi · fiyatlama · portföy izleme
Through-the-Cycle (TTC)
Ne yapar: Ekonomik döngünün uzun vadeli ortalamasını temsil eder. Daha durağandır.
Avantaj: Sermaye gereksinimlerinde döngüsel amplifikasyon yaratmaz. Uzun vadeli planlama için stabil.
Dezavantaj: Anlık riski yansıtmaz. Gerçek bozulmayı geç sinyal verebilir.
IRB sermaye · uzun vadeli limit · portföy planlama
IFRS 9 forward-looking adjustment tam burada devreye girer: TTC tabanlı bir modeli PIT'e "çevirmek" için makroekonomik senaryolar ve geçiş matrisleri kullanılır. Bu, bankaların aynı anda her iki çerçeveyi de çalıştırması gereken karmaşık bir süreçtir — ve model validasyonunda ikisinin birbirinden neden farklı sonuçlar ürettiğini açıklayabilmek zorunludur.
tipik hatalar
Look-ahead bias: Observation window'a referans tarihinden sonraki bilgilerin girmesi. En sık karşılaşılan zaman hatası. Eğitim AUC'u parlak görünür, OOT'da çöker.
İkinci yaygın hata: pencere uzunluklarını gerekçesiz seçmek. "12 ay observation, 12 ay performance" çok yaygın bir seçim — ama neden 12? Ürünün ortalama olgunlaşma süresi nedir, ekonomik döngünün uzunluğu nedir, veri tarihçesi ne kadar geri gidiyor? Bu soruların cevaplanmadan yapılan pencere seçimi kör bir standarttır.
Üçüncüsü: PIT ve TTC modellerinin çıktılarını karıştırmak. Bir PIT modelinin ürettiği PD ile TTC bazlı bir oran karşılaştırıldığında, fark "modelin hatası" değil — iki farklı zamansal felsefeyi karşılaştırmanın sonucudur. Validasyonda bu ayrımı görmek kritiktir.
Katman I tamamlandı. Veriyi tanımladık, ölçümü sorguladık, zamanı kurduk. Katman II'de verinin kendisine bakacağız — dağılımını, sesini, yayılımını okumayı öğreneceğiz.
Siradaki bölüm · Katman II · 04
Ortalama Yalan Söyler: Merkez & Yayılım
→