11.2 Yorumlanabilirliğin Geleceği

Makine öğreniminin yorumlanabiliriğinin olası geleceğine bir göz atalım.

Odak noktası model-agnostik yorumlanabilirlik araçları olacaktır.

Yorumlanabilirliği, altta yatan makine öğrenimi modelinden ayrıştırıldığında otomatikleştirmek çok daha kolaydır. Model-agnostik izlenebilirliğin avantajı modülerliğinde yatmaktadır. Altta yatan makine öğrenimi modelini kolayca değiştirebiliriz. Yorumlama yöntemini de aynı şekilde kolayca değiştirebiliriz. Bu nedenlerle, model-agnostik yöntemler çok daha iyi ölçeklenecektir. Bu yüzden uzun vadede model-agnostik yöntemlerin daha baskın hale geleceğine inanıyorum. Ancak, içsel olarak izlenebilir yöntemlerin de bir yeri olacaktır.

Makine öğrenimi otomatikleştirilecek ve bununla birlikte yorumlanabilirlik de otomatikleştirilecektir.

Zaten görülebilir bir eğilim, model eğitiminin otomasyonudur. Bu, özellik mühendisliği ve seçiminin otomatikleştirilmesini, hiperparametre optimizasyonunun otomatikleştirilmesini, farklı modellerin karşılaştırılmasını ve modellerin ansambl veya istiflenmesini içerir. Sonuç, mümkün olan en iyi tahmin modelidir. Model-agnostik yorumlama yöntemlerini kullandığımızda, bunları otomatik makine öğrenimi sürecinden çıkan herhangi bir modele otomatik olarak uygulayabiliriz. Bir şekilde, bu ikinci adımı da otomatikleştirebiliriz: Özellik önemini otomatik olarak hesaplamak, kısmi bağımlılığı çizmek, vekil bir model eğitmek ve benzeri. Kimse bu tüm model yorumlamalarını otomatik olarak hesaplamanızı engellemiyor. Gerçek yorumlama hala insan gerektirir. Hayal edin: Bir veri seti yüklersiniz, tahmin hedefini belirlersiniz ve bir düğmeye bastığınızda en iyi tahmin modeli eğitilir ve program modelin tüm yorumlamalarını ortaya çıkarır. Zaten ilk ürünler var ve birçok uygulama için bu otomatik makine öğrenimi hizmetlerini kullanmanın yeterli olacağını savunuyorum. Bugün herkes HTML, CSS ve Javascript bilmeden web siteleri oluşturabiliyor, ancak hala birçok web geliştiricisi var. Benzer şekilde, herkesin programlama bilmeden makine öğrenimi modelleri eğitme yeteneğine sahip olacağına ve makine öğrenimi uzmanlarına hala ihtiyaç duyulacağına inanıyorum.

Biz verileri analiz etmiyoruz, modelleri analiz ediyoruz.

Ham veriler kendileri her zaman işe yaramazdır. (Amacım aşırı abartmak. Gerçek şu ki, anlamlı bir analiz yapmak için verilerin derinlemesine anlaşılmasına ihtiyaç vardır.) Ben verilerle ilgilenmiyorum; verilerdeki bilgi ile ilgileniyorum. Yorumlanabilir makine öğrenimi, verilerden bilgi damıtmanın harika bir yoludur. Modeli kapsamlı bir şekilde inceleyebilirsiniz, model otomatik olarak özelliklerin tahmin için ne kadar ilgili olduğunu tanır (çok sayıda modelde yerleşik özellik seçimi vardır), model ilişkilerin nasıl temsil edildiğini otomatik olarak tespit edebilir ve – doğru eğitildiyse – nihai model gerçekliğin çok iyi bir yaklaşık değeridir.

Birçok analitik araç zaten veri modellerine dayanmaktadır (çünkü dağılım varsayımlarına dayanmaktadır):

  • Student’ın t-testi gibi basit hipotez testleri.

  • Karıştırıcılar için ayarlamalarla hipotez testleri (genellikle GLM’ler)

  • Varyans Analizi (ANOVA)

  • Korelasyon katsayısı (standartlaştırılmış doğrusal regresyon katsayısı Pearson’ın korelasyon katsayısı ile ilişkilidir)

Burada size söylediğim aslında hiçbir yenilik değil. Peki neden varsayım tabanlı, şeffaf modelleri analiz etmeyi bırakıp, varsayımsız black box modelleri analiz etmeye geçiyoruz? Çünkü tüm bu varsayımları yapmak sorunludur: Genellikle yanlıdırlar (çoğu insanın Gauss dağılımını takip ettiğine inanmadığınız sürece), kontrol edilmesi zordur, çok esnek değildir ve otomatikleştirilmesi zordur. Birçok alanda, varsayım tabanlı modeller genellikle dokunmamış test verileri üzerinde black box makine öğrenimi modellerine göre daha kötü tahmin performansına sahiptir. Bu, yalnızca büyük veri setleri için geçerlidir, çünkü iyi varsayımlara sahip yorumlanabilir modeller, küçük veri setlerinde black box modellere göre genellikle daha iyi performans gösterir. Black box makine öğrenimi yaklaşımı iyi çalışmak için çok fazla veri gerektirir. Her şeyin dijitalleşmesiyle birlikte, daha da büyük veri setlerimiz olacak ve bu nedenle makine öğrenimi yaklaşımı daha çekici hale gelecektir. Varsayımlar yapmıyoruz, gerçekliği mümkün olduğunca yakından yaklaşık hesaplıyoruz (eğitim verilerinin aşırı uyumunu önleyerek). İstatistikteki tüm araçları sorulara cevap verebilmek için (hipotez testleri, korelasyon ölçütleri, etkileşim ölçütleri, görselleştirme araçları, güven aralıkları, p-değerleri, tahmin aralıkları, olasılık dağılımları) geliştirip, bunları black box modeller için yeniden yazmamız gerektiğini savunuyorum. Bir şekilde, bu zaten oluyor:

  • Klasik bir doğrusal model alalım: Standartlaştırılmış regresyon katsayısı zaten bir özellik önem ölçütüdür. Permütasyon özellik önem ölçütü ile, herhangi bir modelde çalışan bir araç elde ederiz.

  • Bir doğrusal modelde, katsayılar tek bir özelliğin tahmin edilen sonuca etkisini ölçer. Bunun genelleştirilmiş versiyonu kısmi bağımlılık grafiğidir.

  • A veya B’nin daha iyi olup olmadığını test edin: Bunun için kısmi bağımlılık fonksiyonlarını da kullanabiliriz. Henüz (en iyi bilgim dahilinde) herhangi bir black box model için istatistiksel testler yoktur.

  • Veri bilimcileri kendilerini otomatikleştirecekler.

Veri bilimcilerin, birçok analiz ve tahmin görevi için sonunda işlerinden otomatikleştirilerek çıkacaklarına inanıyorum. Bunun gerçekleşmesi için, görevlerin iyi tanımlanmış olması ve etraflarında bazı süreçler ve rutinler olması gerekir. Bugün, bu rutinler ve süreçler eksik, ancak veri bilimcileri ve meslektaşlarım bunlar üzerinde çalışıyorlar. Makine öğrenimi birçok endüstri ve kurumun ayrılmaz bir parçası haline geldikçe, birçok görev otomatikleştirilecektir.

Robotlar ve programlar kendilerini açıklayacaklar.

Makine öğrenimini yoğun bir şekilde kullanan makineler ve programlar için daha sezgisel arayüzlere ihtiyacımız var. Bazı örnekler: Neden aniden durduğunu rapor eden otonom bir araba (“Yolun karşısına çıkacak bir çocuğun %70 olasılığı var”); Bir banka çalışanına bir kredi başvurusunun neden reddedildiğini açıklayan kredi temerrüt programı (“Başvuru sahibinin çok fazla kredi kartı var ve istikrarsız bir işte çalışıyor.”); Bir robot kolunun, öğeyi konveyör banttan çöp kutusuna neden taşıdığını açıklaması (“Öğenin altında çatlak var.”).

Yorumlanabilirlik, makine zekası araştırmalarını artırabilir.

Programların ve makinelerin kendilerini nasıl açıklayabileceği üzerine daha fazla araştırma yaparak, zekayı daha iyi anlayabileceğimizi ve zeki makineler yaratmada daha iyi olabileceğimizi hayal edebiliyorum.

Sonunda, tüm bu tahminler spekülasyondur ve geleceğin gerçekten ne getirdiğini görmek zorundayız. Kendi fikrinizi oluşturun ve öğrenmeye devam edin!

Last updated