Veri Türleri, Granülarite & Zaman Boyutu

Katman I · Veri Okuryazarlığı · 03 / 03

bu bölümün sorusu

Aynı müşteri, farklı bir zaman penceresinden izlenirse farklı bir model nesnesi olur. Zaman, verinin tanımlanmayan ama her şeyi belirleyen üçüncü boyutudur.

zamanin önemi: üç temel boyut

Kredi modelleri zaman içinde var olan nesneleri ölçer. Müşterinin bugünkü davranışı ile 18 ay önceki davranışı farklı sinyaller taşır. Hangi noktadan baktığın, kaç aylık geçmişi kullandığın ve sonucu ne kadar ileri pencerede aradığın — bunların hepsi modelin öğrendiğini şekillendirir.

Bankalarda bu sorun üç kavramda cristalleşir: observation window (değişkenleri ne zaman okudun), performance window (sonucu ne zaman gözledin) ve ikisi arasındaki gap. Bu üçünü yanlış kesmek, modeli teknik olarak çalışır ama anlamsız hale getirir.

snapshot

Tek bir tarihteki kesit. "15 Mart itibariyle müşteri bilgileri." Geçmişi ve dinamiği görmez.

panel veri

Aynı müşterinin zaman içindeki birden fazla gözlemi. Davranışsal değişimi ve mevsimselliği yakalar.

referans tarihi

Modelin "bugün" olarak kabul ettiği an. Observation ve performance window'ların çıkış noktası.

Özellikle dikkat edilmesi gereken kavram: look-ahead bias. Modelin tahmin yaparken kullandığı değişkenlerin, gelecekte gerçekleşecek olaylardan etkilenmiş olması demektir. Referans tarihinden sonraki bilgilerin gözlem penceresine sızması modeli gerçek hayatta işe yaramaz kılar — ama eğitim metriklerini parlak gösterir.

observation window neden önemli?

Çok kısa tutulursa müşteri davranışının mevsimselliği ve döngüsü kaçırılır. Çok uzun tutulursa çok eski ve artık geçersiz bilgi modele girer.

performance window neden önemli?

Çok kısa tutulursa henüz gerçekleşmemiş temerrütler "iyi" sayılır. Çok uzun tutulursa farklı ekonomik dönemlerdeki davranışlar karışır.

Zaman, verinin gizli bir değişkenidir. X ve Y değişkenleri kadar kritik — ama çoğu zaman sessizce tanımlanır ya da hiç tanımlanmaz.

artifact — observation & performance window configurator

Kaydırıcılarla üç zaman penceresini yapılandırın. Observation ve performance window'ların birbirine nasıl oturduğunu, gap sıfıra indiğinde ne olduğunu görün.

interactive — window configurator

katman I · bölüm 03

Gözlem Penceresi 12 ay

Gap (Bekleme) 1 ay

Performans Penceresi 12 ay

gözlem penceresi

12 ay

performans penceresi

12 ay

toplam pencere

25 ay

Yapılandırma dengeli görünüyor. Gözlem ve performans pencereleri arasında 1 aylık gap var — bilgi sızıntısı riski düşük.

Bazı bankalarda gözlem ve performans pencereleri arasındaki gap'i "seasoning period" olarak da tanımlarlar. Bu süre, tahmin anının hemen sonrasındaki kısa dalgalanmaların performans penceresini kirletmesini önler.

point-in-time vs through-the-cycle

Kredi modelleri için zamanın ikinci önemli boyutu: PD tahmininin ekonomik döngüyle olan ilişkisi. Aynı müşteri için, aynı model, iki farklı "zaman felsefesi" altında çok farklı PD üretir.

Point-in-Time (PIT) yaklaşım, modeli anlık ekonomik koşullara duyarlı tutar. Resesyonda PD yükselir, ekonomik genişlemede düşer — bu gerçekçidir ama oyucudur. Through-the-Cycle (TTC) yaklaşım ise uzun vadeli ortalamayı hedefler; döngüsel değişimlerden bağımsız, stabil bir tahmin üretir.

Point-in-Time (PIT)

Ne yapar: Anlık ekonomik koşulları yansıtır. Makro değişkenlerle birlikte hareket eder.

Avantaj: Güncel risk seviyesini gerçekçi gösterir. Stres testi ve fiyatlama için doğal.

Dezavantaj: Döngüsel. Resesyonda yüksek karşılık → kötü dönemde ek baskı yaratır.

IFRS 9 · stres testi · fiyatlama · portföy izleme

Through-the-Cycle (TTC)

Ne yapar: Ekonomik döngünün uzun vadeli ortalamasını temsil eder. Daha durağandır.

Avantaj: Sermaye gereksinimlerinde döngüsel amplifikasyon yaratmaz. Uzun vadeli planlama için stabil.

Dezavantaj: Anlık riski yansıtmaz. Gerçek bozulmayı geç sinyal verebilir.

IRB sermaye · uzun vadeli limit · portföy planlama

IFRS 9 forward-looking adjustment tam burada devreye girer: TTC tabanlı bir modeli PIT'e "çevirmek" için makroekonomik senaryolar ve geçiş matrisleri kullanılır. Bu, bankaların aynı anda her iki çerçeveyi de çalıştırması gereken karmaşık bir süreçtir — ve model validasyonunda ikisinin birbirinden neden farklı sonuçlar ürettiğini açıklayabilmek zorunludur.

tipik hatalar

Look-ahead bias: Observation window'a referans tarihinden sonraki bilgilerin girmesi. En sık karşılaşılan zaman hatası. Eğitim AUC'u parlak görünür, OOT'da çöker.

İkinci yaygın hata: pencere uzunluklarını gerekçesiz seçmek. "12 ay observation, 12 ay performance" çok yaygın bir seçim — ama neden 12? Ürünün ortalama olgunlaşma süresi nedir, ekonomik döngünün uzunluğu nedir, veri tarihçesi ne kadar geri gidiyor? Bu soruların cevaplanmadan yapılan pencere seçimi kör bir standarttır.

Üçüncüsü: PIT ve TTC modellerinin çıktılarını karıştırmak. Bir PIT modelinin ürettiği PD ile TTC bazlı bir oran karşılaştırıldığında, fark "modelin hatası" değil — iki farklı zamansal felsefeyi karşılaştırmanın sonucudur. Validasyonda bu ayrımı görmek kritiktir.

Katman I tamamlandı. Veriyi tanımladık, ölçümü sorguladık, zamanı kurduk. Katman II'de verinin kendisine bakacağız — dağılımını, sesini, yayılımını okumayı öğreneceğiz.

Siradaki bölüm · Katman II · 04

Ortalama Yalan Söyler: Merkez & Yayılım

→