5. Yorumlanabilir Modeller
Yorumlanabilirlik elde etmenin en kolay yolu, yalnızca yorumlanabilir modeller oluşturan belirli algoritma türlerini kullanmaktır. Doğrusal regresyon, lojistik regresyon ve karar ağaçları, yaygın olarak kullanılan yorumlanabilir model örnekleridir.
Takip eden bölümlerde bu modellerden bahsedeceğiz. Ancak ayrıntılı olarak değil, yalnızca temel kavramlara değineceğiz; çünkü bu konularda zaten birçok kitap, video, eğitim materyali ve akademik makale mevcuttur. Odak noktamız, bu modellerin nasıl yorumlanacağıdır. Kitap, doğrusal regresyon, lojistik regresyon, doğrusal regresyonun diğer genişletmeleri, karar ağaçları, karar kuralları ve RuleFit algoritması hakkında ayrıntılı bilgi sunmaktadır. Ayrıca diğer yorumlanabilir modelleri de listelemektedir.
Bu kitaptaki tüm yorumlanabilir modeller, k-en yakın komşu yöntemi dışında modüler düzeyde yorumlanabilir özelliktedir. Aşağıdaki tablo, yorumlanabilir model türlerinin ve özelliklerinin genel bir özetini sunmaktadır. Bir modelin “doğrusal” olması, özellikler ile hedef değişken arasındaki ilişkinin doğrusal olarak modellenmesi anlamına gelir. Monotonluk kısıtlamalarına sahip bir model, bir özellik ile hedef çıktı arasındaki ilişkinin özellik aralığının tamamında aynı yönde devam etmesini sağlar: Özellik değerindeki bir artış, hedef çıktıda ya her zaman bir artışa ya da her zaman bir azalışa neden olur. Monotonluk, bir ilişkiyi anlamayı kolaylaştırdığı için modelin yorumlanabilirliği açısından faydalıdır. Bazı modeller, hedef sonucu tahmin etmek için özellikler arasındaki etkileşimleri otomatik olarak içerebilir. Etkileşimleri, manuel olarak etkileşim özellikleri oluşturarak herhangi bir model türüne dahil edebilirsiniz. Etkileşimler tahmin performansını artırabilir, ancak çok fazla veya çok karmaşık etkileşimler yorumlanabilirliği zorlaştırabilir. Bazı modeller yalnızca regresyon, bazıları yalnızca sınıflandırma yaparken, diğerleri her iki görevi de gerçekleştirebilir.
Bu tablodan, görevinize uygun bir yorumlanabilir modeli seçebilirsiniz; bu ya regresyon (regr) ya da sınıflandırma (class) olabilir:
Doğrusal regresyon
Evet
Evet
Hayır
regr
Lojistik regresyon
Hayır
Evet
Hayır
class
Karar ağaçları
Hayır
Kısmen
Evet
class,regr
RuleFit
Evet
Hayır
Evet
class,regr
Naive Bayes
Hayır
Evet
Hayır
class
k-en yakın komşu
Hayır
Hayır
Hayır
class,regr
Lojistik regresyon ve Naive Bayes'in doğrusal açıklamalar sunduğu da savunulabilir. Ancak bu yalnızca hedefin logaritması için geçerlidir: Bir özelliğin bir puan artması, diğer tüm özelliklerin aynı kaldığı varsayımı altında hedef olasılığının logaritmasını belirli bir miktar artırır.
Last updated