5. Yorumlanabilir Modeller

Yorumlanabilirlik elde etmenin en kolay yolu, yalnızca yorumlanabilir modeller oluşturan belirli algoritma türlerini kullanmaktır. Doğrusal regresyon, lojistik regresyon ve karar ağaçları, yaygın olarak kullanılan yorumlanabilir model örnekleridir.

Takip eden bölümlerde bu modellerden bahsedeceğiz. Ancak ayrıntılı olarak değil, yalnızca temel kavramlara değineceğiz; çünkü bu konularda zaten birçok kitap, video, eğitim materyali ve akademik makale mevcuttur. Odak noktamız, bu modellerin nasıl yorumlanacağıdır. Kitap, doğrusal regresyon, lojistik regresyon, doğrusal regresyonun diğer genişletmeleri, karar ağaçları, karar kuralları ve RuleFit algoritması hakkında ayrıntılı bilgi sunmaktadır. Ayrıca diğer yorumlanabilir modelleri de listelemektedir.

Bu kitaptaki tüm yorumlanabilir modeller, k-en yakın komşu yöntemi dışında modüler düzeyde yorumlanabilir özelliktedir. Aşağıdaki tablo, yorumlanabilir model türlerinin ve özelliklerinin genel bir özetini sunmaktadır. Bir modelin “doğrusal” olması, özellikler ile hedef değişken arasındaki ilişkinin doğrusal olarak modellenmesi anlamına gelir. Monotonluk kısıtlamalarına sahip bir model, bir özellik ile hedef çıktı arasındaki ilişkinin özellik aralığının tamamında aynı yönde devam etmesini sağlar: Özellik değerindeki bir artış, hedef çıktıda ya her zaman bir artışa ya da her zaman bir azalışa neden olur. Monotonluk, bir ilişkiyi anlamayı kolaylaştırdığı için modelin yorumlanabilirliği açısından faydalıdır. Bazı modeller, hedef sonucu tahmin etmek için özellikler arasındaki etkileşimleri otomatik olarak içerebilir. Etkileşimleri, manuel olarak etkileşim özellikleri oluşturarak herhangi bir model türüne dahil edebilirsiniz. Etkileşimler tahmin performansını artırabilir, ancak çok fazla veya çok karmaşık etkileşimler yorumlanabilirliği zorlaştırabilir. Bazı modeller yalnızca regresyon, bazıları yalnızca sınıflandırma yaparken, diğerleri her iki görevi de gerçekleştirebilir.

Bu tablodan, görevinize uygun bir yorumlanabilir modeli seçebilirsiniz; bu ya regresyon (regr) ya da sınıflandırma (class) olabilir:

Algoritma
Doğrusal
Monoton
Etkileşim
Görev

Doğrusal regresyon

Evet

Evet

Hayır

regr

Lojistik regresyon

Hayır

Evet

Hayır

class

Karar ağaçları

Hayır

Kısmen

Evet

class,regr

RuleFit

Evet

Hayır

Evet

class,regr

Naive Bayes

Hayır

Evet

Hayır

class

k-en yakın komşu

Hayır

Hayır

Hayır

class,regr

Lojistik regresyon ve Naive Bayes'in doğrusal açıklamalar sunduğu da savunulabilir. Ancak bu yalnızca hedefin logaritması için geçerlidir: Bir özelliğin bir puan artması, diğer tüm özelliklerin aynı kaldığı varsayımı altında hedef olasılığının logaritmasını belirli bir miktar artırır.

Last updated