هل يمكننا إضافة ميزة في LinearRegression يمكن أن تزيل العلاقة الخطية المتداخلة (علاقة خطية متداخلة دقيقة) في البيانات ؟.
اقتراحي هو إضافة وسيطة إضافية مثل remove_collinearity إذا تم تعيينها من قبل المستخدم ، ثم يمكننا إزالة المتغيرات الخطية الدقيقة باستخدام رتبة المصفوفة أو المتغيرات الخطية باستخدام VIF. هذا يمكن أن يوفر بعض الوقت بدلاً من الذهاب لانحدار ريدج.
قد يكون من الأفضل أن يكون هذا معالجًا أوليًا في sklearn.feature_selection
، وبهذه الطريقة يمكن تطبيقه على مقدرات متعددة. لست متأكدًا من أن العلاقة الخطية المتداخلة الدقيقة هي مشكلة متكررة بالرغم من ذلك. ربما مقدر مع عتبة ارتباط سمة محددة من قبل المستخدم؟
لست متأكدًا مما إذا كان هذا شيئًا يتم إجراؤه غالبًا ، بدلاً من قول تجميع الميزات؟ يمكن إجراء هذا الأخير في scikit-Learn باستخدام الكتلة .FeatureAgglomeration على الرغم من أنه ربما لا تكون الواجهة مع n_clusters المطلوبة مثالية.
cc @ glemaitre
يتم العمل على هذا كمحول اختيار ميزة هنا: https://github.com/scikit-learn/scikit-learn/pull/14698
شكرا حقا. إغلاق هذه المشكلة كنسخة مكررة من https://github.com/scikit-learn/scikit-learn/issues/13405 ثم. إذا كانت لديك أية تعليقات أو اقتراحات أخرى على @ divyaprabha123 يرجى التعليق عليها.
التعليق الأكثر فائدة
يتم العمل على هذا كمحول اختيار ميزة هنا: https://github.com/scikit-learn/scikit-learn/pull/14698