Bisakah kita menambahkan fitur di LinearRegression yang bisa menghilangkan collinearity (kolinieritas persis) pada data?.
Proposal saya adalah menambahkan argumen tambahan seperti remove_collinearity jika disetel oleh pengguna maka kita dapat menghapus variabel collinear yang tepat menggunakan peringkat matriks atau variabel collinear menggunakan VIF. Ini dapat menghemat waktu daripada menggunakan regresi Ridge.
Mungkin lebih baik untuk memiliki ini sebagai prepreprocessor di sklearn.feature_selection
, dengan cara itu dapat diterapkan ke banyak estimator. Saya tidak yakin bahwa collinearity yang tepat adalah masalah yang sering terjadi. Mungkin penaksir dengan ambang batas korelasi fitur yang ditentukan pengguna?
Saya tidak yakin apakah itu sesuatu yang sering dilakukan, dibandingkan dengan pengelompokan fitur? Yang terakhir dapat dilakukan di scikit-belajar dengan cluster.FeatureAgglomeration meskipun mungkin antarmuka dengan n_cluster yang diperlukan tidak ideal.
cc @glemaitre
Ini sedang dikerjakan sebagai transformator pemilihan fitur di sini: https://github.com/scikit-learn/scikit-learn/pull/14698
Memang terima kasih. Menutup masalah ini sebagai duplikat dari https://github.com/scikit-learn/scikit-learn/issues/13405 lalu. Jika Anda memiliki komentar atau saran lain @divyaprabha123 silahkan berkomentar disana.
Komentar yang paling membantu
Ini sedang dikerjakan sebagai transformator pemilihan fitur di sini: https://github.com/scikit-learn/scikit-learn/pull/14698