Yorumlanabilir Makine Öğrenmesi
  • Yorumlanabilir Yapay Öğrenme
  • Bölüm 1 - Yazarın Önsözü
  • Bölüm 1.1 Çevirmenin Önsözü
  • Bölüm 2 - Giriş
    • 2.1 Hikaye Zamanı
    • 2.2 Makine Öğrenmesi Nedir?
    • 2.3 Terminoloji
  • 3. Yorumlanabilirlik
    • 3.1 Yorumlanabilirliğin Önemi
    • 3.2 Yorumlanabilirlik Yöntemlerinin Sınıflandırılması
    • 3.3 Yorumlanabilirliğin Kapsamı
    • 3.4 Yorumlanabilirliğin Değerlendirilmesi
    • 3.5 Açıklamaların Özellikleri
    • 3.6 İnsan Dostu Açıklamalar
  • 4 Veri Setleri
    • 4.1 Bisiklet Kiralama (Bike Rentals)- Regresyon
    • 4.2 Youtube Spam Yorumları (Metin Sınıflandırma)
    • 4.3 Rahim Ağzı Kanseri Risk Faktörleri (Sınıflandırma)
  • 5. Yorumlanabilir Modeller
    • 5.1 Doğrusal Regresyon (Linear Regression)
    • 5.2 Lojistik Regresyon (Logistic Regression)
    • 5.3 GLM, GAM ve Fazlası
    • 5.4 Karar Ağaçları (Decision Tre)
    • 5.5 Karar Kuralları (Decision Rules)
    • 5.6 RuleFit
    • 5.7 Diğer Yorumlanabilir Modeller
  • 6. Model Agnostik Metotlar (Model-Agnostic Methods)
  • 7. Örnek Tabanlı Açıklamalar (Example-Based Explanations)
  • 8.Küresel Model Agnostik Metotlar (Global Model-Agnostic Methods)
    • 8.1 Kısmi Bağımlılık Grafiği - Partial Dependency Plot
    • 8.2. Biriktirilmiş Yerel Etki (Accumulated Local Effects-ALE) Grafikleri
    • 8.3 Öznitelik Etkileşimi (Feature Interaction)
    • 8.4 Fonksiyonel Ayrıştırma (Functional Decomposition)
    • 8.5 Permütasyon Öznitelik Önemi (Permutation Feature Importance)
    • 8.6 Küresel Vekil Modeli (Global Surrogate)
    • 8.7 Prototipler ve Eleştiriler (Prototypes and Criticisms)
  • 9. Yerel Modelden Bağımsız Yöntemler (Local Model-Agnostic Methods)
    • 9.1 Bireysel Koşullu Beklenti (Individual Conditional Expectation)
    • 9.2 Yerel Vekil (Local Surrogate) (LIME)
    • 9.3 Karşıt Gerçekçi Açıklamalar (Counterfactual Explanations)
    • 9.4 Kapsamlı Kurallar (Scoped Rules (Anchors))
    • 9.5 Shapley Değerleri (Shapley Values)
    • 9.6 SHAP (SHapley Additive exPlanations)
  • 10. Sinir Ağları Yorumlaması
    • 10.1 Öğrenilmiş Özellikler (Learned Features)
    • 10.2 Piksel İlişkilendirmesi (Pixel Attribution)
    • 10.3 Kavramları Belirleme (Detecting Concepts)
    • 10.4 Kötü Amaçlı Örnekler (Adversarial Examples)
    • 10.5 Etkili Örnekler (Influential Instances)
  • 11. Kristal Küreye Bir Bakış
    • 11.1 Makine Öğrenmesinin Geleceği
      • 11.2 Yorumlanabilirliğin Geleceği
  • 12. Teşekkürler
  • Referanslar
  • Kullanılan R paketleri
Powered by GitBook
On this page
  1. 4 Veri Setleri

4.3 Rahim Ağzı Kanseri Risk Faktörleri (Sınıflandırma)

Previous4.2 Youtube Spam Yorumları (Metin Sınıflandırma)Next5. Yorumlanabilir Modeller

Last updated 5 months ago

Rahim ağzı kanseri veri kümesi, bir kadının rahim ağzı kanseri olup olmayacağını tahmin etmek için göstergeler ve risk faktörlerini içermektedir. Özellikler arasında demografik veriler (örneğin yaş), yaşam tarzı ve tıbbi geçmiş bulunmaktadır. Veri, deposundan indirilebilir ve Fernandes, Cardoso ve Fernandes (2017) tarafından tanımlanmıştır.

Kitaptaki örneklerde kullanılan veri özelliklerinin bir alt kümesi şunlardır:

  • Yaş (yıl olarak)

  • Cinsel partner sayısı

  • İlk cinsel ilişki yaşı (yıl olarak)

  • Gebelik sayısı

  • Sigara kullanımı (evet veya hayır)

  • Sigara kullanma süresi (yıl olarak)

  • Hormonal doğum kontrol kullanımı (evet veya hayır)

  • Hormonal doğum kontrol süresi (yıl olarak)

  • Rahim içi araç (RİA) kullanımı (evet veya hayır)

  • Rahim içi araç (RİA) kullanım süresi (yıl olarak)

  • Hastanın daha önce cinsel yolla bulaşan bir hastalık (STD) geçirip geçirmediği (evet veya hayır)

  • STD teşhis sayısı

  • İlk STD teşhisinden bu yana geçen süre

  • Son STD teşhisinden bu yana geçen süre

  • Biyopsi sonucu: "Sağlıklı" veya "Kanser" (Hedef değişken)

Biyopsi, rahim ağzı kanseri teşhisi için altın standart olarak kabul edilmektedir. Bu kitaptaki örneklerde, biyopsi sonucu hedef değişken olarak kullanılmıştır. Her sütunda eksik olan değerler en sık görülen değerle tamamlanmıştır; ancak, bu iyi bir çözüm olmayabilir çünkü gerçek yanıt, bir değerin eksik olma olasılığı ile ilişkili olabilir. Soruların özel doğası nedeniyle muhtemelen bir önyargı mevcuttur. Ancak, bu kitap eksik veri tamamlama hakkında olmadığından, örnekler için en sık görülen değerin kullanılması yeterli kabul edilmiştir.

Bu veri kümesiyle kitaptaki örnekleri yeniden üretmek için, veri ön işleme R-skriptine ve nihai RData dosyasına kitabın GitHub deposundan ulaşabilirsiniz.


Fernandes, Kelwin, Jaime S Cardoso ve Jessica Fernandes. “Transfer learning with partial observability applied to cervical cancer screening.” In Iberian Conference on Pattern Recognition and Image Analysis, 243–50. Springer. (2017).

UCI Makine Öğrenmesi