Evalml: Penjelasan prediksi

Dibuat pada 15 Apr 2020 · 8Komentar · Sumber: alteryx/evalml

Fitur baru yang dapat kami tambahkan untuk pemahaman model adalah penjelasan prediksi. Ini akan menjawab pertanyaan "mengapa model saya memprediksi x?", memungkinkan pengguna untuk melihat fitur input mana yang paling berdampak pada prediksi tersebut. Fitur semacam ini dapat berguna untuk men-debug model dari perspektif penyiapan data, karena pengguna dapat memeriksa prediksi yang mereka kategorikan sebagai "buruk" dan mengubah atau menghilangkan fitur yang berkontribusi pada prediksi tersebut.

Beberapa sumber daya:

epic needs design new feature

Sumber

dsherry

👍1

Komentar yang paling membantu

Kita harus melihat menggunakan SHAP (SHapley Additive exPlanations)
https://github.com/slundberg/shap
Saya menemukan perpustakaan ini melalui buku catatan ini:
https://github.com/d6t/d6t-python/blob/master/blogs/blog-20200426-shapley.ipynb

gsheni pada 7 Mei 2020

👍2

Semua 8 komentar

gsheni pada 7 Mei 2020

👍2

Dokumen Desain: https://alteryx.quip.com/D4ZwAOUklY5X/Prediction-Explanations

freddyaboulton pada 20 Jul 2020

@freddyaboulton dan saya bertemu untuk membahas ini kemarin. Ini siap untuk diimplementasikan. Di bawah ini adalah rencana implementasi dari dokumen desain :

Tugas
Fase 1

Menerapkan algoritma interpretasi (1 hari rekayasa dan pengujian, 1 hari peninjauan).
1. Tambahkan metode compute_features ke PipelineBase (metode pribadi)
2. Menerapkan ShapIntrepeter
Menerapkan UI interpretasi (1 hari rekayasa dan pengujian, 1 hari peninjauan).
1. Terapkan explain_prediction
Tulis/tambahkan tutorial untuk menampilkan fungsionalitas baru (1 hari rekayasa dan pengujian, 1 hari peninjauan).
1. Tambahkan ke Panduan Pengguna
2. Pertimbangkan untuk menambahkan sesuatu ke Tutorial
Analisis Kualitatif kualitas penjelasan: (3 hari)
1. Jalankan AutoML pada kumpulan data yang sulit.
2. Ambil beberapa jalur pipa dan pastikan penjelasan prediksi masuk akal.
3. Mengejek set data dan menjalankan penelusuran AutoML, lalu menjelaskan prediksi.
4. Tambahkan buku catatan di repo
Tugas Peregangan: Mengevaluasi kinerja pada banyak kumpulan data.

Catatan: sampai semua ini selesai, kita harus merahasiakan implementasi untuk rilis Juli, yaitu _explain_prediction

Perkiraan keseluruhan: 9 hari

Fase 2

Terapkan explain_predictions, yang menemukan dan menjelaskan n prediksi paling/paling tidak percaya diri. (5 hari)

Perkiraan keseluruhan: 5 hari

Tanggal Penting
Rilis Juli: 28 Juli 2020.

Sasaran
Gabungkan Fase 1 pada Sel 4 Agustus
Gabungkan Fase 2 pada Selasa, 11 Agustus

Peregangan Tujuan
Gabungkan Fase 1 pada Selasa 28 Juli (rilis Juli)
Gabungkan Fase 2 pada Sel 4 Agustus

dsherry pada 21 Jul 2020

Hai @freddyaboulton , hingga saat ini kami telah menyimpan epik di jalur Epic dan alih-alih memindahkan masalah individu melalui jalur. Bisakah Anda mengikuti pola itu di sini juga? Jika itu terasa aneh atau salah bagi Anda, dengan senang hati mendiskusikan perubahan proses kami tentang cara kami mengatur epos. Cukup sederhana saat ini.

dsherry pada 23 Jul 2020

@dsherry Kesalahan saya! Menjaga epos dalam alur epik masuk akal bagi saya 👍

freddyaboulton pada 23 Jul 2020

👍1

@freddyaboulton dari sudut pandang saya, kita harus selesai meninjau analisis kualitatif yang Anda lakukan (yang sangat membantu!!), menyelesaikan diskusi tersebut dan mungkin membuat beberapa perbaikan/pembaruan. Tapi apa yang saya lihat di sana sudah terasa cukup baik untuk dipublikasikan untuk bulan Juli!

Untuk mengonfirmasi: explain_predictions sekarang bersifat publik, di dokumen API dan kami menambahkan panduan pengguna, benar? Berarti itu akan menjadi bagian dari rilis Juli? Sangat bagus!!

dsherry pada 28 Jul 2020

@freddyaboulton bisakah epik ini ditutup?

dsherry pada 28 Agu 2020

@dsherry Saya pikir setelah kami mendapatkan #1107 bergabung, kami dapat menutup ini!

freddyaboulton pada 28 Agu 2020

Apakah halaman ini membantu?

0 / 5 - 0 peringkat

Masalah terkait

Performa buruk pada kumpulan data berlian

dsherry · 3Komentar

AutoML: gunakan pemisahan CV terpisah untuk ansambel

angela97lin · 4Komentar

Tambahkan plot ketergantungan parsial

dsherry · 3Komentar

Dokumen: Panah Belakang di Halaman Instal

chukarsten · 4Komentar

BalancedClassificationDataCVSplit menghasilkan pemisahan yang berbeda setiap kali dipanggil

freddyaboulton · 3Komentar