3.2 Yorumlanabilirlik Yöntemlerinin Sınıflandırılması

Çeşitli ölçütlere göre yapay öğrenme yorumlanabilirlik yöntemleri sınıflandırılabilir.

Doğrudan ya da Sonradan Yorumlanabilir mi? Bu ölçüt, yorumlanabilirliğin yapay öğrenme modelinin karmaşıklığını sınırlayarak (doğrudan) ya da model eğitildikten sonra analiz yöntemleri uygulanarak (sonradan) sağlanıp sağlanmadığını ayırt eder. Doğrudan yorumlanabilirlik, basit yapısından dolayı yorumlanabilir kabul edilen kısa karar ağaçları veya seyrek doğrusal modeller gibi yapay öğrenme modellerini ifade eder. Sonradan yorumlanabilirlik ise, model eğitildikten sonra uygulanan yorumlama yöntemlerini ifade eder. Örneğin, permütasyon özelliği önemi, sonradan yorumlama yöntemi olarak kullanılır. Sonradan yöntemler, doğrudan yorumlanabilir modellere de uygulanabilir; örneğin, permütasyon özelliği önemi karar ağaçları için de hesaplanabilir. Bu kitabın bölümleri, doğrudan yorumlanabilir modeller ile sonradan (ve modelden bağımsız) yorumlama yöntemleri arasındaki ayrım temelinde düzenlenmiştir.

Yorumlama Yönteminin Sonucu Çeşitli yorumlama yöntemleri, elde edilen sonuçlara göre kabaca sınıflandırılabilir.

  • Özellik Özeti İstatistikleri: Birçok yorumlama yöntemi her özellik için özet istatistikler sağlar. Bazı yöntemler, özellik başına tek bir sayı (örneğin, özellik önemi) veya ikili özellik etkileşimlerinin gücü gibi daha karmaşık sonuçlar verir ve bu durum her özellik çifti için bir sayı içerir.

  • Özellik Özeti Görselleştirmesi: Çoğu özellik özet istatistiği görselleştirilebilir. Bazı özellik özetleri, görselleştirildiğinde daha anlamlı hale gelir ve tablo olarak sunulması yanlış bir tercih olabilir. Örneğin, bir özelliğin kısmi bağımlılığı bu türdendir. Kısmi bağımlılık grafikleri, bir özelliği ve ortalama tahmin edilen sonucu gösteren eğrilerdir. Kısmi bağımlılıkları sunmanın en iyi yolu, koordinatları basmak yerine eğriyi çizmektir.

  • Modelin İçsel Yapısı (ör. öğrenilmiş ağırlıklar): Doğrudan yorumlanabilir modellerin yorumlanması bu kategoriye girer. Örnekler arasında doğrusal modellerdeki ağırlıklar veya karar ağaçlarının öğrenilmiş yapı (bölümlemeler için kullanılan özellikler ve eşikler) bulunur. Doğrusal modellerde ağırlıklar hem model iç yapısına hem de özellik özet istatistiklerine örnektir. Özellik dedektörlerinin evrişimli sinir ağlarında görselleştirilmesi de bu kategoriye girer. Model iç yapısını gösteren yorumlanabilirlik yöntemleri tanım gereği model özeldir (bkz. bir sonraki ölçüt).

  • Veri Noktası: Bu kategori, modeli yorumlanabilir kılmak için veri noktaları (mevcut veya yeni oluşturulmuş) döndüren yöntemleri içerir. Örneğin, karşı-olgusal açıklamalar yöntemi bir veri örneğinin tahminini açıklamak için bazı özellikleri değiştirerek tahmin edilen sonucun önemli bir şekilde değiştiği (örneğin, sınıfın tersine döndüğü) benzer bir veri noktasını bulur. Öngörülen sınıfların prototiplerinin belirlenmesi de buna örnektir. Yeni veri noktaları oluşturan yorumlama yöntemlerinin yararlı olabilmesi için veri noktalarının kendilerinin yorumlanabilir olması gerekir; bu, görseller ve metinler için iyi işleyen ancak yüzlerce özelliğe sahip tablo verileri için daha az yararlı olan bir durumdur.

  • Doğrudan Yorumlanabilir Model: Kara kutu modelleri yorumlamak için bir çözüm, onları yorumlanabilir bir model ile (küresel veya yerel olarak) yaklaşık olarak modellemektir. Bu yorumlanabilir modelin kendisi, modelin içsel parametrelerine veya özellik özet istatistiklerine bakılarak yorumlanır.

Model-Özgü mü Yoksa Modelden Bağımsız mı? Model-özgü yorumlama araçları belirli model sınıflarıyla sınırlıdır. Doğrusal bir modelde regresyon ağırlıklarının yorumlanması, doğrudan yorumlanabilir modellerin yorumlanmasının tanımı gereği her zaman model-özgü olduğu bir model-özgü yorumlama örneğidir. Örneğin, yalnızca sinir ağlarının yorumlanmasında kullanılan araçlar model-özgüdür. Modelden bağımsız araçlar herhangi bir yapay öğrenme modeline uygulanabilir ve model eğitildikten sonra (sonradan) kullanılır. Bu türden yöntemler genellikle özellik giriş-çıkış çiftlerini analiz ederek çalışır. Tanımı gereği, bu yöntemlerin ağırlıklar veya yapısal bilgi gibi modelin iç yapısına erişimi yoktur.

Yerel mi Yoksa Küresel mi? Yorumlama yöntemi bireysel bir tahmini mi yoksa tüm modelin davranışını mı açıklar? Yoksa kapsam ara bir yerde mi? Bir sonraki bölümde kapsam ölçütü hakkında daha fazla bilgi bulabilirsiniz.

Last updated