データの共線性(正確な共線性)を削除できる機能をLinearRegressionに追加できますか?
私の提案は、remove_collinearityのような引数をユーザーが設定した場合に追加することです。そうすれば、行列のランクを使用して正確な共線変数を削除したり、VIFを使用して共線変数を削除したりできます。 これにより、リッジ回帰を行う代わりに時間を節約できます。
これをsklearn.feature_selection
プリプリプロセッサとして持つ方が良いかもしれません。そうすれば、複数の推定器に適用できます。 ただし、正確な共線性が頻繁に問題になるかどうかはわかりません。 たぶん、ユーザー定義の特徴相関しきい値を持つ推定量?
機能のクラスタリングとは対照的に、それが頻繁に行われることであるかどうかはわかりませんか? 後者は、cluster.FeatureAgglomerationを使用してscikit-learnで実行できますが、必要なn_clustersを使用したインターフェイスは理想的ではない可能性があります。
cc @glemaitre
これは、ここで特徴選択トランスフォーマーとして取り組んでいます: https :
本当にありがとう。 次に、この問題をhttps://github.com/scikit-learn/scikit-learn/issues/13405の複製としてクローズし@ divyaprabha123にコメントしてください。
最も参考になるコメント
これは、ここで特徴選択トランスフォーマーとして取り組んでいます: https :