我们可以在 LinearRegression 中添加一个可以消除数据中的共线性(精确共线性)的特征吗?
我的建议是添加一个额外的参数,如 remove_collinearity,如果它是由用户设置的,那么我们可以使用矩阵的秩或使用 VIF 的共线变量删除精确的共线变量。 这可以节省一些时间,而不是进行岭回归。
将它作为sklearn.feature_selection
的预处理器可能会更好,这样它就可以应用于多个估计器。 我不确定确切的共线性是一个常见的问题。 也许是具有用户定义的特征相关阈值的估计器?
我不确定这是不是经常做的事情,而不是说特征聚类? 后者可以在带有 cluster.FeatureAgglomeration 的 scikit-learn 中完成,尽管与所需的 n_clusters 的接口可能并不理想。
抄送@glemaitre
这是在这里作为特征选择转换器工作的: https :
确实谢谢。 然后将此问题作为https://github.com/scikit-learn/scikit-learn/issues/13405的副本关闭。 如果您有其他意见或建议@divyaprabha123,请在那里发表评论。
最有用的评论
这是在这里作为特征选择转换器工作的: https :