merkez eğilim: tek sayı yetersizdir
Bir portföydeki "ortalama gelir" arttı — bu haber iyi mi? Cevap: bilmiyoruz. Eğer 100 müşterinin 99'u aynı yerde kalıp biri çok zenginleştiyse, ortalama yükseldi ama tipik müşteri hiç değişmedi. Ortalama, uç değerlere aşırı duyarlıdır.
Bu yüzden merkez eğilim için üç ölçü birlikte düşünülür: ortalama (tüm değerlerin toplamı / sayısı), medyan (sıralı listedeki ortadaki değer) ve mod (en sık görülen değer). Normal dağılımda üçü örtüşür. Gerçek hayatta — özellikle bankacılıkta — çoğu değişken çarpıktır ve üçü arasında ciddi farklar oluşur.
Merkez kadar önemli olan ikinci boyut yayılımdır: değerlerin ortalamanın çevresinde ne kadar dağıldığı. Standart sapma ve IQR (çeyreklerarası aralık), dağılımın "genişliğini" ölçer. Yüksek yayılım, ortalamaya güvenmenin daha tehlikeli olduğunu söyler.
Medyan: Uç değerlere dayanıklı; "tipik değeri" daha iyi temsil eder.
Mod: En sık rastlanan değer; kategorik değişkenlerde kullanışlı.
IQR: %25–%75 arası aralık. Uç değerlerden bağımsız, sağlam yayılım ölçüsü.
Aralık (range): Basit ama yanıltıcı; tek bir aykırı değer tüm ölçüyü bozar.
artifact — mean trap simulator
100 müşteriden oluşan sabit bir gelir portföyü. Kaydırıcıyla yüksek gelirli müşteri ekleyin ve ortalamanın medyandan nasıl koptuğunu izleyin. Turuncu çizgi ortalama, yeşil çizgi medyandır.
bankacılıkta dağılım okumak
Kredi modellerinde değişkenlerin büyük çoğunluğu çarpık dağılım gösterir. Bu hem özellik mühendisliğinde hem de modelin hangi merkez ölçüsüyle değerlendirileceğinde kritik sonuçlar doğurur.
| Değişken | Tipik Dağılım | Neden Önemli? |
|---|---|---|
| Gelir | log-normal / sağa çarpık | Ortalama gelir, "tipik" müşteriyi temsil etmez. Medyan daha iyi bir ölçüdür. Model için log dönüşümü sıklıkla uygulanır. |
| LGD (Kayıp Oranı) | bimodal (%0 veya yüksek) | Çoğu temerrüt ya tam tahsil edilir ya da ciddi kayıpla kapanır. Ne ortalama ne de medyan tek başına yeterlidir; dağılımın tamamı modellenmeli. |
| Gecikme Günü (DPD) | sola yığılmış / exponential | Müşterilerin büyük çoğunluğu 0 günde. Az bir kısım çok yüksek DPD değerlerinde. Ortalama bu ayrımı yok sayar. |
| Kredi Kart Kullanım Oranı | sağa çarpık / U-şekilli | %0 veya %100 kutuplarında yoğunlaşma. Ortalama (%50 civarı) en az gözlemlenen değer olabilir. |
| Maruz Kalma (EAD) | log-normal | Portföy bazında dağılımın kuyruğu sermaye hesaplamalarını doğrudan etkiler. Ortalama EAD yeterli değil; VaR ve ES kuyruk ölçüleri gerekir. |
tipik hata
İkinci yaygın hata: standart sapmayı tek yayılım ölçüsü olarak kullanmak. Std. sapma, aykırı değerlere ortalama kadar duyarlıdır. LGD gibi bimodal bir dağılımda std. sapma anlamsız hale gelir. IQR veya yüzdelik dilimler (P10, P90) çok daha sağlam bilgi taşır.
Bir validatörün görevi: "Ortalama X'tir" ifadesini duyduğunda refleks olarak şunu sormak — "hangi dağılım üzerinden, hangi uç değerler var, medyan ne?"