Xgboost: هل هناك على أي حال لترجمة نماذج XGBoost إلى نماذج Weka للحصول على أداء أفضل في الاستدلال

تم إنشاؤها على ١ يوليو ٢٠١٦  ·  3تعليقات  ·  مصدر: dmlc/xgboost

أهلا،
هل هناك أي طريقة لترجمة نماذج XGBoost إلى طرازات Weka؟

لدي مشكلة غريبة في كفاءة نماذج xgboost في وقت الاستدلال.

لقد قمت بتعيين عدد الجولات / الأشجار على 1 ، وعمق الأشجار على 108 وأنا أستخدم حزمة jvm لمشكلة تصنيف متعددة الفئات.

توقع 6000 حالة باستخدام أشجار XGBoost عندما أقوم بإنشاء مثيلات واحدة تلو الأخرى بما في ذلك إنشاء DMatrix والاستدلال / التنبؤ يستغرق 380 مللي ثانية.
(باستثناء إنشاء DMatrix يستغرق 180 مللي ثانية).

// creating a DMatrix with one row and the numberOfFeatures
// columns
double startTime = System.nanoTime();
DMatrix testInstance = new DMatrix(testingInstance, 1, numberOfFeatures, 9999F);
// predict just one instance
float[][] predicts = booster.predict(testInstance);
predictionTime += (System.nanoTime() - startTime) / 1e6;

ومع ذلك ، عندما أتوقع / استنتجهم باستخدام غابات Weka العشوائية ، يستغرق الأمر 30 مللي ثانية فقط.

بالنسبة لعدد الجولات (الأشجار) = 50 ، تتنبأ غابات WEKA العشوائية بـ 6000 حالة في 922 مللي ثانية وتتنبأ أشجار XGBoost بها في 3429 مللي ثانية.

المشكلة هي أن دقة أشجار XGBoost أفضل بكثير من الغابات العشوائية. ومع ذلك ، فإن وقت الاستدلال مهم جدًا أيضًا في حالتي.

لذا ، هل هناك على أي حال لتحويل نماذج XGBoost إلى نماذج WEKA؟!
أو هل لديك أي فكرة كيف يمكنني جعل التنبؤ أسرع ؟! هل مشكلة الكفاءة بسبب استدعاء المكتبات الأصلية من شفرة مصدر جافا؟

شكرا.

التعليق الأكثر فائدة

ويرجع ذلك أساسًا إلى أن الواجهة الحالية لم يتم تصميمها للتسجيل عبر الإنترنت (لكل حالة) ولكن بدلاً من ذلك لتسجيل الدُفعات. سوف تتولى النفقات العامة لإنشاء DMatrix للتسجيل عبر الإنترنت. نحتاج إلى واجهة تسجيل مخصصة عبر الإنترنت لهذه الحالة.

ال 3 كومينتر

من الجدول المعياري على https://github.com/komiya-atsushi/xgboost-predictor-java : تنبؤ جافا الخالص أسرع بما يصل إلى 4 أوامر من حيث الحجم! يجب أن يكون هناك شيء غير فعال بشكل رهيب في مكان ما في واجهة xgboost Java ... أنا أفكر في استخدام التهديف المستند إلى java في مرحلة ما ، لكنني أفضل عدم الاعتماد على مشروع آخر بعيدًا عن ذلك.

ويرجع ذلك أساسًا إلى أن الواجهة الحالية لم يتم تصميمها للتسجيل عبر الإنترنت (لكل حالة) ولكن بدلاً من ذلك لتسجيل الدُفعات. سوف تتولى النفقات العامة لإنشاء DMatrix للتسجيل عبر الإنترنت. نحتاج إلى واجهة تسجيل مخصصة عبر الإنترنت لهذه الحالة.

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات

القضايا ذات الصلة

tqchen picture tqchen  ·  4تعليقات

RanaivosonHerimanitra picture RanaivosonHerimanitra  ·  3تعليقات

FabHan picture FabHan  ·  4تعليقات

uasthana15 picture uasthana15  ·  4تعليقات

colinsongf picture colinsongf  ·  4تعليقات