ols: en küçük kareler yöntemi
Lineer regresyon, y = β₀ + β₁x + ε modelini verilere uydurur. OLS (Ordinary Least Squares), bu uydurma işlemi için kullanılan standarttır: artıkların karelerinin toplamını minimize eden β₀ ve β₁ değerlerini bulur.
Artık (residual), her gözlem için gerçek y ile modelin tahmin ettiği ŷ arasındaki farktır: eᵢ = yᵢ − ŷᵢ. OLS, Σeᵢ² değerini minimize eder. "Neden karesi?" sorusu önemlidir: negatif ve pozitif artıkların birbirini iptal etmemesi, büyük hataları orantısız cezalandırmak (outlier'ları modeli bozmaktan korumak ama onları da hesaba katmak).
Katsayı yorumu: β₁, x'de 1 birimlik artışın y'yi ortalama kaç birim değiştirdiğini söyler — diğer değişkenler sabit tutulduğunda. Bu "diğerleri sabit" şartı, çoklu regresyonda özellikle kritiktir.
artifact — regresyon labı: ols playground
Teminat oranı (x) ile LGD (y) ilişkisi. β₀ (sabit) ve β₁ (eğim) kaydırıcılarını ayarlayın, Toplam Kare Hata'nın nasıl değiştiğini izleyin. Sonra "OLS Çözümü" ile minimize eden noktaya atlayın.
dört varsayım: her biri ihlal edilirse ne olur?
OLS tahmincisinin "en iyi doğrusal sapmasız tahminleyici" (BLUE) olması için dört Gauss-Markov varsayımının sağlanması gerekir. Bankacılık verisinde en az birinin ihlali neredeyse kaçınılmazdır — önemli olan ihlali fark etmek ve modeli buna göre adapte etmektir.
İhlal: Artık saçılım grafiğinde belirgin bir eğri örüntü. Bankada: Gelir ile LGD non-lineer ilişkili. Çözüm: log dönüşümü, polinom terim, non-lineer model.
İhlal: Durbin-Watson istatistiği. Bankada: Aynı müşteriden çoklu gözlem — panel verinin doğal sonucu. Çözüm: Clustered standart hatalar, mixed model.
İhlal: Artık vs fitted plot'ta huni şekli. Bankada: Yüksek EAD kredilerde LGD daha değişken. Çözüm: WLS, robust standart hatalar.
İhlal: QQ plot ile görülür. Bankada: LGD bimodal, artıklar non-normal. Büyük örneklemde CLT sayesinde tahmin hâlâ geçerli ama testler dikkat ister.
tipik hata
İkinci yanılgı: artıkları incelememek. OLS'nin sihri, artıklar gerçekten random bir gürültü gibi davrandığında çalışır. Artık saçılım grafiği (residuals vs fitted), model kalitesinin en bilgilendirici görünümüdür — ama çoğu zaman ihmal edilir. Validasyonun sorgulaması: "Artık analizi yapıldı mı, sonuçları belgelendi mi?"