5.7 Diğer Yorumlanabilir Modeller
Yorumlanabilir modellerin listesi sürekli büyümekte ve boyutu bilinmemektedir. Bu liste, doğrusal modeller, karar ağaçları ve Naive Bayes gibi basit modelleri içerirken, aynı zamanda yorumlanamaz makine öğrenimi modellerini daha yorumlanabilir hale getirmek için bunları birleştiren veya değiştiren daha karmaşık modelleri de kapsamaktadır. Özellikle bu tür modeller üzerine yapılan yayınlar şu anda yüksek bir sıklıkta üretilmekte ve gelişmeleri takip etmek zorlaşmaktadır. Bu bölümde kitap yalnızca Naive Bayes sınıflandırıcısını ve k-en yakın komşu yöntemini kısaca ele almaktadır.
5.7.1 Naive Bayes Sınıflandırıcısı Naive Bayes sınıflandırıcısı, koşullu olasılıklar için Bayes teoremini kullanır. Her bir özellik için, bu özelliğin değerine bağlı olarak bir sınıfın olasılığını hesaplar. Naive Bayes sınıflandırıcısı, özelliklerin koşullu bağımsızlığına dair güçlü (= naif) bir varsayıma eşdeğer şekilde, her bir özelliğin sınıf olasılıklarını bağımsız olarak hesaplar. Naive Bayes bir koşullu olasılık modelidir ve bir sınıfın olasılığını şu şekilde modeller:
Z terimi, tüm sınıflar için olasılıkların toplamının 1 olmasını sağlayan bir ölçekleme parametresidir (aksi takdirde bunlar olasılık olmazdı). Bir sınıfın koşullu olasılığı, sınıf olasılığı ile her bir özelliğin sınıfa bağlı olasılığının çarpımının Z ile normalize edilmesiyle hesaplanır. Bu formül Bayes teoremi kullanılarak türetilebilir.
Naive Bayes, bağımsızlık varsayımı nedeniyle yorumlanabilir bir modeldir. Modüler seviyede yorumlanabilir. Her bir özelliğin belirli bir sınıf tahminine ne kadar katkıda bulunduğu çok net bir şekilde görülebilir, çünkü koşullu olasılık yorumlanabilir.
5.7.2 K-En Yakın Komşu K-en yakın komşu yöntemi hem regresyon hem de sınıflandırma için kullanılabilir ve bir veri noktası için tahmin yapmak üzere en yakın komşuları kullanır. Sınıflandırma için k-en yakın komşu yöntemi, bir örneğin en yakın komşularının en yaygın sınıfını atar. Regresyon için komşuların sonuçlarının ortalamasını alır. Zor tarafları doğru k değerini bulmak ve örnekler arasındaki mesafeyi ölçme yöntemine karar vermektir; bu nihayetinde mahalleyi tanımlar.
K-en yakın komşu modeli, bu kitapta sunulan diğer yorumlanabilir modellerden farklıdır çünkü bu bir örnek tabanlı öğrenme algoritmasıdır. Peki k-en yakın komşular nasıl yorumlanabilir? İlk olarak, öğrenilecek parametreler yoktur, dolayısıyla modüler seviyede bir yorumlanabilirlik yoktur. Ayrıca, model doğal olarak yerel olduğu ve açıkça öğrenilmiş küresel ağırlıklar veya yapılar bulunmadığı için küresel model yorumlanabilirliği eksiktir. Yerel seviyede yorumlanabilir mi? Bir tahmini açıklamak için her zaman tahminde kullanılan k komşuyu geri çağırabilirsiniz. Modelin yorumlanabilirliği yalnızca veri kümesindeki bir örneği ‘yorumlayıp yorumlayamayacağınıza’ bağlıdır. Eğer bir örnek yüzlerce veya binlerce özelliğe sahipse bunun yorumlanabilir olmadığını söyleyebilirim. Ancak az sayıda özelliğiniz varsa veya örneğinizi en önemli özelliklere indirgeme yönteminiz varsa, k-en yakın komşuları sunmak iyi açıklamalar sağlayabilir.
Last updated