sigmoid: lineer girdiden olasılık çıktısı
Lineer regresyon, β₀ + β₁x tahminini üretir — bu değer teorik olarak −∞'dan +∞'a uzanır. Ama olasılık [0,1] aralığında olmalıdır. Sigmoid fonksiyonu bu köprüyü kurar: her gerçel sayıyı 0 ile 1 arasına iter, simetrik bir S-eğrisi üzerinde.
Logit dönüşümü, sigmoid'in tersini alır: log(p / (1−p)) = β₀ + β₁x. Solda "log-odds" — log olasılık oranı. Bu dönüşüm sayesinde, olasılıklar log-odds uzayında lineer hareket eder ve model bir lineer denklem olarak kalır.
β₁ yorumu: x'te 1 birimlik artış, log-odds'u β₁ kadar değiştirir. Odds oranı e^β₁ olur. Örneğin β₁ = 0.5 ise: her 1 birimlik DTI artışında temerrüt odds'u ~%65 artar (e^0.5 ≈ 1.65).
artifact — lojistik eğri: sigmoid etkileşimi
Risk skoru yükseldikçe temerrüt olasılığı artıyor. β₀ eğriyi yatay kaydırır (karar sınırı). β₁ eğrinin dikliğini belirler — büyük β₁ = net ayrım. "MLE Çözümü" ile veriye en uygun sigmoid'i bulun.
maximum likelihood: olasılıksal öğrenmenin dili
OLS, kare hataları minimize eder. MLE ise farklı bir soru sorar: "Hangi β değerleri, gözlemlediğimiz veriyi en yüksek olasılıkla üretirdi?" İkili çıktı için bu daha doğal bir çerçevedir.
Logistic regression'ın closed-form çözümü yoktur — OLS'nin aksine. Gradient descent, IRLS (Iteratively Reweighted Least Squares) veya Newton-Raphson ile iteratif olarak bulunur. Modern istatistik yazılımları (statsmodels, SAS, R) bu optimizasyonu arka planda yapar.
Cross-entropy loss ile bağlantısı: Neural network eğitiminde kullanılan "binary cross-entropy loss" = −log-likelihood. Logistic regression ve tek katmanlı bir sigmoid sinir ağı matematiksel olarak tamamen aynıdır. Fark: isim, framework ve ölçek.
tipik hata
İkinci yanılgı: β₁'i "etki büyüklüğü" olarak okumak. β₁ log-odds değişimidir — 0.5 değeri "tahmin %50 artar" demez. Odds oranına çevrilmesi gerekir: e^0.5 ≈ 1.65. "Bu özellik 1 birim artınca temerrüt olasılığı %65 çarpıcı artar" — bu doğru okuma. Doğrudan olasılık değişimi için marginal etki hesaplanmalı.