Fairness, Bias & Etik AI · Veri Bilimi Yol Haritasi

Katman X · Yorumlanabilirlik vs Tahmin Gücü · 29 / 29

Fairness, Bias & Etik AI

bu bölümün sorusu

İki grup farklı risk profiline sahip. Eşit onay oranı verirsek kalibrasyon bozulur. Eşit kalibrasyon sağlarsak onay oranları farklılaşır. Bu çatışma matematiksel mi, etik mi — ve ne yapılabilir?

fairness imkânsızlık teoremi: üç tanım bir arada sağlanamaz

Fairness, makine öğrenmesinde matematiksel olarak birden fazla tanıma sahiptir. Ve bu tanımlar, grupların risk profilleri farklı olduğunda eş zamanlı karşılanamaz. Bu Chouldechova (2017) teoremi tarafından kanıtlanmıştır.

Demografik Paritet: Tüm gruplarda eşit onay oranı. Eşit Fırsat: Gerçek iyi müşterilerin eşit onay alma oranı (TPR). Kalibrasyon Adaleti: Onaylanan müşteriler içinde eşit temerrüt oranı. Grupların gerçek risk oranları farklıysa bu üçü bir arada sağlanamaz.

Bu bir etik başarısızlık değil, matematiksel bir kısıttır. "Hangi tanım öncelikli?" sorusu teknik değil, değer ve politika sorusudur. Veri bilimcinin rolü bu çatışmayı görünür kılmak, karar vermek değil.

artifact — fairness çatışma görselleştirici

İki grup farklı popülasyon temerrüt oranına sahip. Tek Eşik modunda: her iki gruba aynı skor eşiği uygulanır. Eşit Onay modunda: onay oranlarını eşitlemek için farklı eşikler kullanılır. Her iki durumda dört fairness metriği ne yapıyor?

interactive — fairness çatışma görselleştirici

katman X · bölüm 29

Grup A — popülasyon DR %8

Grup B — popülasyon DR %20

Model eşiği (skor < t → onayla) 5.5

Onay Oranı Farkı

—

Demografik paritet

Disparate Impact

—

4/5 kural: ≥ 0.80

TPR Farkı

—

Eşit fırsat

Kalibrasyon Farkı

—

DR onaylananlar arası

Tek eşik modunda: popülasyon DR'leri farklı olduğu için onay oranları ayrışır — Demografik Paritet ihlali. Eşit Onay modunda: kalibrasyon bozulur, yani A grubu onaylananlar daha yüksek DR taşır. Bu Chouldechova teoreminin gerçek zamanlı demonstrasyonudur.

bankacılıkta fairness: hukuki çerçeve ve pratik

Türk bankacılık mevzuatında cinsiyet, ırk ve din kredi kararında doğrudan kullanılamaz. Ama dolaylı ayrımcılık daha zordur: korelasyon üzerinden korunan özelliği öğrenen modeller yasal risk taşır.

Posta kodu, mağaza kategorisi, bazı davranışsal özellikler — gelir veya etnisite ile yüksek korelasyonlu "proxy değişkenler" olabilir. Model bu değişkenleri kullanırken farkında olmadan ayrımcılık yapıyor olabilir.

Validasyon sorusu: PD modeli segmente göre ayrı kalibrasyon kontrolünden geçirildi mi? Özellikle yaş grubu ve coğrafya bazlı sapma var mı? Varsa bu hem teknik (model hatası) hem yasal (ayrımcılık) risk içerebilir.

tipik hata

Yaygın yanılgı: "Korunan değişkenleri modelden çıkardık, adiliz." Yalnızca yaşı çıkarmak yeterli değildir — korelasyonlu değişkenler üzerinden dolaylı etki sürer. Gerçek kontrol: farklı demografik gruplarda onay oranı, TPR ve kalibrasyon metriklerinin ayrı ayrı izlenmesi.

Katman XI: zamansal boyut — vintage analizi ile başlıyoruz.

Sıradaki bölüm · Katman XI · 30

Vintage Analizi & Survival Sezgisi

→