3. Yorumlanabilirlik

Yorumlanabilirliği (matematiksel olarak) tanımlamak zordur. Miller (2017)'den hoşuma giden (matematiksel olmayan) bir yorumlanabilirlik tanımı şudur: Yorumlanabilirlik, bir insanın bir kararın nedenini anlayabilme derecesidir [3]. Bir diğer tanım ise şöyledir: Yorumlanabilirlik, bir insanın modelin sonucunu tutarlı bir şekilde tahmin edebilme derecesidir [4]. Bir makine öğrenimi modelinin yorumlanabilirliği ne kadar yüksekse, birinin belirli kararları veya tahminlerin neden yapıldığını anlaması o kadar kolaydır. Bir model, kararlarını diğer bir modelden daha kolay anlayabilen bir insan için daha iyi yorumlanabilir bir modeldir. Yorumlanabilir ve açıklanabilir terimlerini birbirinin yerine kullanacağım. Miller (2017) gibi, yorumlanabilirlik/açıklanabilirlik ve açıklama terimleri arasında ayrım yapmanın mantıklı olduğunu düşünüyorum. Bireysel tahminlerin açıklamaları için "açıklama" terimini kullanacağım. İyi bir açıklamanın ne olduğunu öğrenmek için açıklamalar bölümüne bakın.

Yorumlanabilir makine öğrenimi, verilerde bulunan veya model tarafından öğrenilen ilişkilerle ilgili "ilgili bilgilerin bir makine öğrenimi modelinden çıkarılmasını" kapsayan faydalı bir genel terimdir [5].


  1. Miller, Tim. “Explanation in artificial intelligence: Insights from the social sciences.” arXiv Preprint arXiv:1706.07269. (2017).↩︎

  2. Kim, Been, Rajiv Khanna, and Oluwasanmi O. Koyejo. “Examples are not enough, learn to criticize! Criticism for interpretability.” Advances in Neural Information Processing Systems (2016).↩︎

  3. Murdoch, W. J., Singh, C., Kumbier, K., Abbasi-Asl, R., & Yu, B. “Definitions, methods, and applications in interpretable machine learning.” Proceedings of the National Academy of Sciences, 116(44), 22071-22080. (2019).↩︎

Last updated