Katman II · Tanımlayıcı İstatistik · 04 / 06
Ortalama Yalan Söyler: Merkez & Yayılım
bu bölümün sorusu
Tek bir sayı, dağılımın özetini verir ama hikâyesini gizler. Ortalama neden yanıltır, medyan ne söyler, yayılım neden bunların ikisinden de önemlidir?

merkez eğilim: tek sayı yetersizdir

Bir portföydeki "ortalama gelir" arttı — bu haber iyi mi? Cevap: bilmiyoruz. Eğer 100 müşterinin 99'u aynı yerde kalıp biri çok zenginleştiyse, ortalama yükseldi ama tipik müşteri hiç değişmedi. Ortalama, uç değerlere aşırı duyarlıdır.

Bu yüzden merkez eğilim için üç ölçü birlikte düşünülür: ortalama (tüm değerlerin toplamı / sayısı), medyan (sıralı listedeki ortadaki değer) ve mod (en sık görülen değer). Normal dağılımda üçü örtüşür. Gerçek hayatta — özellikle bankacılıkta — çoğu değişken çarpıktır ve üçü arasında ciddi farklar oluşur.

Merkez kadar önemli olan ikinci boyut yayılımdır: değerlerin ortalamanın çevresinde ne kadar dağıldığı. Standart sapma ve IQR (çeyreklerarası aralık), dağılımın "genişliğini" ölçer. Yüksek yayılım, ortalamaya güvenmenin daha tehlikeli olduğunu söyler.

merkez ölçüleri
Ortalama: Uç değerlere duyarlı, sağa çarpık dağılımda yukarı çekilir.
Medyan: Uç değerlere dayanıklı; "tipik değeri" daha iyi temsil eder.
Mod: En sık rastlanan değer; kategorik değişkenlerde kullanışlı.
yayılım ölçüleri
Std. Sapma: Ortalamadan sapmanın tipik büyüklüğü. Uç değerlere duyarlı.
IQR: %25–%75 arası aralık. Uç değerlerden bağımsız, sağlam yayılım ölçüsü.
Aralık (range): Basit ama yanıltıcı; tek bir aykırı değer tüm ölçüyü bozar.

artifact — mean trap simulator

100 müşteriden oluşan sabit bir gelir portföyü. Kaydırıcıyla yüksek gelirli müşteri ekleyin ve ortalamanın medyandan nasıl koptuğunu izleyin. Turuncu çizgi ortalama, yeşil çizgi medyandır.

interactive — mean trap simulator
katman II · bölüm 04
Ortalama
Medyan
Temel gelir grubu
Yüksek gelir eklenince
Yüksek gelirli müşteri ekle 0
ortalama gelir
medyan gelir
aradaki fark
Ortalama, bir istatistik değil; bir yanılsamadır. Bir ayağı buz küpünde, diğeri ocakta olan birinin "ortalama sıcaklığı" iyidir — ama o kişi iyide değildir.

bankacılıkta dağılım okumak

Kredi modellerinde değişkenlerin büyük çoğunluğu çarpık dağılım gösterir. Bu hem özellik mühendisliğinde hem de modelin hangi merkez ölçüsüyle değerlendirileceğinde kritik sonuçlar doğurur.

Değişken Tipik Dağılım Neden Önemli?
Gelir log-normal / sağa çarpık Ortalama gelir, "tipik" müşteriyi temsil etmez. Medyan daha iyi bir ölçüdür. Model için log dönüşümü sıklıkla uygulanır.
LGD (Kayıp Oranı) bimodal (%0 veya yüksek) Çoğu temerrüt ya tam tahsil edilir ya da ciddi kayıpla kapanır. Ne ortalama ne de medyan tek başına yeterlidir; dağılımın tamamı modellenmeli.
Gecikme Günü (DPD) sola yığılmış / exponential Müşterilerin büyük çoğunluğu 0 günde. Az bir kısım çok yüksek DPD değerlerinde. Ortalama bu ayrımı yok sayar.
Kredi Kart Kullanım Oranı sağa çarpık / U-şekilli %0 veya %100 kutuplarında yoğunlaşma. Ortalama (%50 civarı) en az gözlemlenen değer olabilir.
Maruz Kalma (EAD) log-normal Portföy bazında dağılımın kuyruğu sermaye hesaplamalarını doğrudan etkiler. Ortalama EAD yeterli değil; VaR ve ES kuyruk ölçüleri gerekir.
Bir kredi modeli kurarken değişkenlerin dağılımını anlamak sadece "veri temizleme" adımı değil; modelin neyi öğreneceğini belirleyen kritik bir tasarım kararıdır. Log-normal dağılımlı bir değişkeni log dönüşümü yapmadan modele sokmak, lineer model için ciddi performans kaybına yol açar.

tipik hata

Yaygın yanılgı: "Ortalama gelir müşteri profilimizi temsil eder." Hayır — temsil etmiyordur. Sağa çarpık bir dağılımda ortalama, müşterilerin yalnızca üst %30'unun gelirini yansıtıyor olabilir. Segmentasyon kararları, fiyatlama ve kredi limiti politikaları bu yanılgıyla kurulursa portföy seçimi sistematik olarak bozulur.

İkinci yaygın hata: standart sapmayı tek yayılım ölçüsü olarak kullanmak. Std. sapma, aykırı değerlere ortalama kadar duyarlıdır. LGD gibi bimodal bir dağılımda std. sapma anlamsız hale gelir. IQR veya yüzdelik dilimler (P10, P90) çok daha sağlam bilgi taşır.

Bir validatörün görevi: "Ortalama X'tir" ifadesini duyduğunda refleks olarak şunu sormak — "hangi dağılım üzerinden, hangi uç değerler var, medyan ne?"

Sıradaki adım: Merkezi ve yayılımı anladık. Peki dağılım aileleri neden farklıdır — ve bankacılıkta hangi değişken neden hangi aileye aittir?
Sıradaki bölüm · Katman II · 05
Dağılım Aileleri & Bankada Karşılığı