10. Sinir Ağları Yorumlaması
Aşağıdaki bölümler sinir ağları için yorumlama (interpretation) yöntemlerine odaklanmaktadır. Bu yöntemler, bir sinir ağının öğrendiği özellikleri ve kavramları görselleştirir, bireysel tahminleri açıklar ve sinir ağlarını basitleştirir.
Derin öğrenme (deep learning) özellikle görüntü ve metin gibi alanlarda (örn. görüntü sınıflandırma ve dil çevirisi) çok başarılı olmuştur. Derin sinir ağlarının başarı öyküsü 2012 yılında, ImageNet görüntü sınıflandırma yarışmasını 74 bir derin öğrenme yaklaşımının kazanmasıyla başladı. O zamandan beri, giderek daha derin ve daha fazla ağırlık parametresine sahip ağlara yönelik bir eğilimle, çok çeşitli derin sinir ağı mimarilerinin adeta “Kambriyen patlamasına” tanık oluyoruz.
Bir sinir ağıyla tahmin yapmak için, veri girişi, öğrenilmiş ağırlıklarla yapılan çok sayıda çarpım katmanından ve doğrusal olmayan dönüşümlerden (non-linear transformations) geçer. Tek bir tahmin, sinir ağının mimarisine bağlı olarak milyonlarca matematiksel işlem içerebilir. Biz insanların, veri girişinden tahmine kadar giden tam eşleştirmeyi adım adım izlemesi mümkün değildir. Bir sinir ağının yaptığı bir tahmini anlamak için birbiriyle karmaşık biçimde etkileşen milyonlarca ağırlığı ele almamız gerekir. Bu yüzden, sinir ağlarının davranışını ve tahminlerini yorumlamak için özel yorumlama yöntemlerine ihtiyaç duyarız. Bölümlerde, evrişimli sinir ağları (CNN) dahil olmak üzere derin öğrenmeye aşina olduğunuz varsayılmaktadır.
Elbette yerel modeller veya kısmi bağımlılık grafikleri (partial dependence plots) gibi modelden bağımsız yöntemleri kullanabiliriz, ancak sinir ağlarına özgü geliştirilmiş yorumlama yöntemlerini dikkate almak için iki neden vardır: İlk olarak, sinir ağları gizli katmanlarında özellikler ve kavramlar öğrenir ve bunları ortaya çıkarmak için özel araçlara ihtiyaç duyarız. İkinci olarak, gradyan (gradient) kullanılarak, sinir ağını “dışarıdan” inceleyen modelden bağımsız yöntemlere kıyasla, hesaplama açısından daha verimli yorumlama yöntemleri uygulanabilir. Ayrıca, bu kitaptaki diğer yöntemlerin çoğu tablo verileri için modelleri yorumlamak üzere tasarlanmıştır. Görüntü ve metin verileri farklı yöntemler gerektirir.
Sıradaki bölümler, farklı sorulara yanıt veren şu teknikleri ele almaktadır:
Learned Features (Öğrenilmiş Özellikler): Sinir ağı hangi özellikleri öğrenmiştir?
Pixel Attribution (Saliency Maps) (Piksel Atıfı / Görselleştirme Haritaları): Belirli bir tahmin üzerinde her pikselin katkısı nedir?
Concepts (Kavramlar): Sinir ağının öğrendiği daha soyut kavramlar hangileridir?
Adversarial Examples (Kötü Amaçlı Örnekler), karşıt gerçekçi (counterfactual) açıklamalarla yakından ilişkilidir: Sinir ağını nasıl kandırabiliriz?
Influential Instances (Etkili Örnekler), sinir ağları gibi gradyan tabanlı yöntemler için hızlı bir uygulaması olan, daha genel bir yaklaşımdır: Belirli bir tahmin için, eğitimdeki bir veri noktası ne kadar etkili olmuştur?
Last updated