4.3 Rahim Ağzı Kanseri Risk Faktörleri (Sınıflandırma)
Rahim ağzı kanseri veri kümesi, bir kadının rahim ağzı kanseri olup olmayacağını tahmin etmek için göstergeler ve risk faktörlerini içermektedir. Özellikler arasında demografik veriler (örneğin yaş), yaşam tarzı ve tıbbi geçmiş bulunmaktadır. Veri, UCI Makine Öğrenmesi deposundan indirilebilir ve Fernandes, Cardoso ve Fernandes (2017) tarafından tanımlanmıştır.
Kitaptaki örneklerde kullanılan veri özelliklerinin bir alt kümesi şunlardır:
Yaş (yıl olarak)
Cinsel partner sayısı
İlk cinsel ilişki yaşı (yıl olarak)
Gebelik sayısı
Sigara kullanımı (evet veya hayır)
Sigara kullanma süresi (yıl olarak)
Hormonal doğum kontrol kullanımı (evet veya hayır)
Hormonal doğum kontrol süresi (yıl olarak)
Rahim içi araç (RİA) kullanımı (evet veya hayır)
Rahim içi araç (RİA) kullanım süresi (yıl olarak)
Hastanın daha önce cinsel yolla bulaşan bir hastalık (STD) geçirip geçirmediği (evet veya hayır)
STD teşhis sayısı
İlk STD teşhisinden bu yana geçen süre
Son STD teşhisinden bu yana geçen süre
Biyopsi sonucu: "Sağlıklı" veya "Kanser" (Hedef değişken)
Biyopsi, rahim ağzı kanseri teşhisi için altın standart olarak kabul edilmektedir. Bu kitaptaki örneklerde, biyopsi sonucu hedef değişken olarak kullanılmıştır. Her sütunda eksik olan değerler en sık görülen değerle tamamlanmıştır; ancak, bu iyi bir çözüm olmayabilir çünkü gerçek yanıt, bir değerin eksik olma olasılığı ile ilişkili olabilir. Soruların özel doğası nedeniyle muhtemelen bir önyargı mevcuttur. Ancak, bu kitap eksik veri tamamlama hakkında olmadığından, örnekler için en sık görülen değerin kullanılması yeterli kabul edilmiştir.
Bu veri kümesiyle kitaptaki örnekleri yeniden üretmek için, veri ön işleme R-skriptine ve nihai RData dosyasına kitabın GitHub deposundan ulaşabilirsiniz.
Fernandes, Kelwin, Jaime S Cardoso ve Jessica Fernandes. “Transfer learning with partial observability applied to cervical cancer screening.” In Iberian Conference on Pattern Recognition and Image Analysis, 243–50. Springer. (2017).
Last updated