Scikit-learn: 共線変数の削除のサポートを追加

作成日 2020年02月03日  ·  3コメント  ·  ソース: scikit-learn/scikit-learn

有効にするワークフローを説明してください

データの共線性(正確な共線性)を削除できる機能をLinearRegressionに追加できますか?

提案されたソリューションを説明してください

私の提案は、remove_collinearityのような引数をユーザーが設定した場合に追加することです。そうすれば、行列のランクを使用して正確な共線変数を削除したり、VIFを使用して共線変数を削除したりできます。 これにより、リッジ回帰を行う代わりに時間を節約できます。

New Feature

最も参考になるコメント

これは、ここで特徴選択トランスフォーマーとして取り組んでいます: https

全てのコメント3件

これをsklearn.feature_selectionプリプリプロセッサとして持つ方が良いかもしれません。そうすれば、複数の推定器に適用できます。 ただし、正確な共線性が頻繁に問題になるかどうかはわかりません。 たぶん、ユーザー定義の特徴相関しきい値を持つ推定量?

機能のクラスタリングとは対照的に、それが頻繁に行われることであるかどうかはわかりませんか? 後者は、cluster.FeatureAgglomerationを使用してscikit-learnで実行できますが、必要なn_clustersを使用したインターフェイスは理想的ではない可能性があります。

cc @glemaitre

これは、ここで特徴選択トランスフォーマーとして取り組んでいます: https

本当にありがとう。 次に、この問題をhttps://github.com/scikit-learn/scikit-learn/issues/13405の複製としてクローズし@ divyaprabha123にコメントしてください。

このページは役に立ちましたか?
0 / 5 - 0 評価