Scikit-learn: أضف دعمًا لإسقاط المتغيرات الخطية

تم إنشاؤها على ٣ فبراير ٢٠٢٠  ·  3تعليقات  ·  مصدر: scikit-learn/scikit-learn

صِف سير العمل الذي تريد تمكينه

هل يمكننا إضافة ميزة في LinearRegression يمكن أن تزيل العلاقة الخطية المتداخلة (علاقة خطية متداخلة دقيقة) في البيانات ؟.

صِف حلك المقترح

اقتراحي هو إضافة وسيطة إضافية مثل remove_collinearity إذا تم تعيينها من قبل المستخدم ، ثم يمكننا إزالة المتغيرات الخطية الدقيقة باستخدام رتبة المصفوفة أو المتغيرات الخطية باستخدام VIF. هذا يمكن أن يوفر بعض الوقت بدلاً من الذهاب لانحدار ريدج.

New Feature

التعليق الأكثر فائدة

يتم العمل على هذا كمحول اختيار ميزة هنا: https://github.com/scikit-learn/scikit-learn/pull/14698

ال 3 كومينتر

قد يكون من الأفضل أن يكون هذا معالجًا أوليًا في sklearn.feature_selection ، وبهذه الطريقة يمكن تطبيقه على مقدرات متعددة. لست متأكدًا من أن العلاقة الخطية المتداخلة الدقيقة هي مشكلة متكررة بالرغم من ذلك. ربما مقدر مع عتبة ارتباط سمة محددة من قبل المستخدم؟

لست متأكدًا مما إذا كان هذا شيئًا يتم إجراؤه غالبًا ، بدلاً من قول تجميع الميزات؟ يمكن إجراء هذا الأخير في scikit-Learn باستخدام الكتلة .FeatureAgglomeration على الرغم من أنه ربما لا تكون الواجهة مع n_clusters المطلوبة مثالية.

cc @ glemaitre

يتم العمل على هذا كمحول اختيار ميزة هنا: https://github.com/scikit-learn/scikit-learn/pull/14698

شكرا حقا. إغلاق هذه المشكلة كنسخة مكررة من https://github.com/scikit-learn/scikit-learn/issues/13405 ثم. إذا كانت لديك أية تعليقات أو اقتراحات أخرى على @ divyaprabha123 يرجى التعليق عليها.

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات