Scikit-learn: 共線変数の削除のサポートを追加

作成日 2020年02月03日 · 3コメント · ソース: scikit-learn/scikit-learn

データの共線性（正確な共線性）を削除できる機能をLinearRegressionに追加できますか？

私の提案は、remove_collinearityのような引数をユーザーが設定した場合に追加することです。そうすれば、行列のランクを使用して正確な共線変数を削除したり、VIFを使用して共線変数を削除したりできます。これにより、リッジ回帰を行う代わりに時間を節約できます。

New Feature

ソース

divyaprabha123

最も参考になるコメント

これは、ここで特徴選択トランスフォーマーとして取り組んでいます： https ：

thomasjpfan 2020年02月03日

👍2

これをsklearn.feature_selectionプリプリプロセッサとして持つ方が良いかもしれません。そうすれば、複数の推定器に適用できます。ただし、正確な共線性が頻繁に問題になるかどうかはわかりません。たぶん、ユーザー定義の特徴相関しきい値を持つ推定量？

機能のクラスタリングとは対照的に、それが頻繁に行われることであるかどうかはわかりませんか？後者は、cluster.FeatureAgglomerationを使用してscikit-learnで実行できますが、必要なn_clustersを使用したインターフェイスは理想的ではない可能性があります。

cc @glemaitre

rth 2020年02月03日

これは、ここで特徴選択トランスフォーマーとして取り組んでいます： https ：

thomasjpfan 2020年02月03日

👍2

本当にありがとう。次に、この問題をhttps://github.com/scikit-learn/scikit-learn/issues/13405の複製としてクローズし@ divyaprabha123にコメントしてください。

rth 2020年02月03日

👍1

このページは役に立ちましたか？

0 / 5 - 0 評価

正準相関分析（CCA）の予期しない動作

shauli-ravfogel · 3コメント

[0.23.1] doctest GradientBoostingClassifierがarm（rhel）プロセッサで失敗する

murata-yu · 3コメント

変圧器ステップでなしのパイプラインでのグリッド検索中にエラーが発生しました

jrbourbeau · 3コメント

紺碧のパイプラインバッジをreadmeに追加しますか？

amueller · 3コメント

パイプラインからプルされたpickle化モデルをロードするときにインポートエラーが発生しました

bmulas1535 · 3コメント