Scikit-learn: Tambahkan dukungan untuk menjatuhkan variabel collinear

Dibuat pada 3 Feb 2020  ·  3Komentar  ·  Sumber: scikit-learn/scikit-learn

Jelaskan alur kerja yang ingin Anda aktifkan

Bisakah kita menambahkan fitur di LinearRegression yang bisa menghilangkan collinearity (kolinieritas persis) pada data?.

Jelaskan solusi yang Anda usulkan

Proposal saya adalah menambahkan argumen tambahan seperti remove_collinearity jika disetel oleh pengguna maka kita dapat menghapus variabel collinear yang tepat menggunakan peringkat matriks atau variabel collinear menggunakan VIF. Ini dapat menghemat waktu daripada menggunakan regresi Ridge.

New Feature

Komentar yang paling membantu

Ini sedang dikerjakan sebagai transformator pemilihan fitur di sini: https://github.com/scikit-learn/scikit-learn/pull/14698

Semua 3 komentar

Mungkin lebih baik untuk memiliki ini sebagai prepreprocessor di sklearn.feature_selection , dengan cara itu dapat diterapkan ke banyak estimator. Saya tidak yakin bahwa collinearity yang tepat adalah masalah yang sering terjadi. Mungkin penaksir dengan ambang batas korelasi fitur yang ditentukan pengguna?

Saya tidak yakin apakah itu sesuatu yang sering dilakukan, dibandingkan dengan pengelompokan fitur? Yang terakhir dapat dilakukan di scikit-belajar dengan cluster.FeatureAgglomeration meskipun mungkin antarmuka dengan n_cluster yang diperlukan tidak ideal.

cc @glemaitre

Ini sedang dikerjakan sebagai transformator pemilihan fitur di sini: https://github.com/scikit-learn/scikit-learn/pull/14698

Memang terima kasih. Menutup masalah ini sebagai duplikat dari https://github.com/scikit-learn/scikit-learn/issues/13405 lalu. Jika Anda memiliki komentar atau saran lain @divyaprabha123 silahkan berkomentar disana.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat