Katman X · Yorumlanabilirlik vs Tahmin Gücü · 29 / 29
Fairness, Bias & Etik AI
bu bölümün sorusu
İki grup farklı risk profiline sahip. Eşit onay oranı verirsek kalibrasyon bozulur. Eşit kalibrasyon sağlarsak onay oranları farklılaşır. Bu çatışma matematiksel mi, etik mi — ve ne yapılabilir?
fairness imkânsızlık teoremi: üç tanım bir arada sağlanamaz
Fairness, makine öğrenmesinde matematiksel olarak birden fazla tanıma sahiptir. Ve bu tanımlar, grupların risk profilleri farklı olduğunda eş zamanlı karşılanamaz. Bu Chouldechova (2017) teoremi tarafından kanıtlanmıştır.
Demografik Paritet: Tüm gruplarda eşit onay oranı. Eşit Fırsat: Gerçek iyi müşterilerin eşit onay alma oranı (TPR). Kalibrasyon Adaleti: Onaylanan müşteriler içinde eşit temerrüt oranı. Grupların gerçek risk oranları farklıysa bu üçü bir arada sağlanamaz.
Bu bir etik başarısızlık değil, matematiksel bir kısıttır. "Hangi tanım öncelikli?" sorusu teknik değil, değer ve politika sorusudur. Veri bilimcinin rolü bu çatışmayı görünür kılmak, karar vermek değil.
artifact — fairness çatışma görselleştirici
İki grup farklı popülasyon temerrüt oranına sahip. Tek Eşik modunda: her iki gruba aynı skor eşiği uygulanır. Eşit Onay modunda: onay oranlarını eşitlemek için farklı eşikler kullanılır. Her iki durumda dört fairness metriği ne yapıyor?
interactive — fairness çatışma görselleştirici
katman X · bölüm 29
Grup A — popülasyon DR%8
Grup B — popülasyon DR%20
Model eşiği (skor < t → onayla)5.5
Onay Oranı Farkı
—
Demografik paritet
Disparate Impact
—
4/5 kural: ≥ 0.80
TPR Farkı
—
Eşit fırsat
Kalibrasyon Farkı
—
DR onaylananlar arası
Tek eşik modunda: popülasyon DR'leri farklı olduğu için onay oranları ayrışır — Demografik Paritet ihlali. Eşit Onay modunda: kalibrasyon bozulur, yani A grubu onaylananlar daha yüksek DR taşır. Bu Chouldechova teoreminin gerçek zamanlı demonstrasyonudur.
bankacılıkta fairness: hukuki çerçeve ve pratik
Türk bankacılık mevzuatında cinsiyet, ırk ve din kredi kararında doğrudan kullanılamaz. Ama dolaylı ayrımcılık daha zordur: korelasyon üzerinden korunan özelliği öğrenen modeller yasal risk taşır.
Posta kodu, mağaza kategorisi, bazı davranışsal özellikler — gelir veya etnisite ile yüksek korelasyonlu "proxy değişkenler" olabilir. Model bu değişkenleri kullanırken farkında olmadan ayrımcılık yapıyor olabilir.
Validasyon sorusu: PD modeli segmente göre ayrı kalibrasyon kontrolünden geçirildi mi? Özellikle yaş grubu ve coğrafya bazlı sapma var mı? Varsa bu hem teknik (model hatası) hem yasal (ayrımcılık) risk içerebilir.
tipik hata
Yaygın yanılgı: "Korunan değişkenleri modelden çıkardık, adiliz." Yalnızca yaşı çıkarmak yeterli değildir — korelasyonlu değişkenler üzerinden dolaylı etki sürer. Gerçek kontrol: farklı demografik gruplarda onay oranı, TPR ve kalibrasyon metriklerinin ayrı ayrı izlenmesi.
Katman XI: zamansal boyut — vintage analizi ile başlıyoruz.