تتعقب هذه الملحمة جميع المشكلات المتعلقة بدمج Woodwork DataTables في EvalML.
ملاحظات هنا: https://alteryx.quip.com/XedaAs9HXc9f/EvalML-Woodwork-Table-Integration
مستند التصميم هنا: https://alteryx.quip.com/Oa4aA6h0Rf2k/Woodwork ShareTable-Integration-Design-Document
خطة التنفيذ:
أضف وثائق حول الأنواع التي نتوقع أن يتم تعيينها فئويًا ورقميًا ونصًا حتى يتمكن automl من التعامل مع الميزات بشكل صحيح ، وكذلك تحذير المستخدمين مما قد يحدث إذا مر المستخدمون في pandas DataFrames / numpy arrays. 2 أيام
تحديث خطوط الأنابيب وجميع المكونات لقبول WW DataTables: أسبوع واحد
المجموع: 3 أسابيع 3 أيام ، ثم أسبوع آخر للقيام بالرسوم البيانية / الأدوات.
التواريخ الرئيسية
إصدار أكتوبر هو الثلاثاء 27 أكتوبر.
المرمى
أكمل الكل بحلول الجمعة 6 نوفمبر (4 أسابيع). الشحن في إصدار نوفمبر.
امتداد الهدف
كل شيء باستثناء الرسوم البيانية / الأدوات التي تم إجراؤها بواسطة إصدار أكتوبر (27 أكتوبر).
@ angela97lin : أعتقد أننا يجب أن نتخلى عن أنواع جداول بيانات جديدة لن ندعمها في البداية. ثم يمكننا إضافة الدعم لهؤلاء على أساس كل حالة على حدة. لذا:
dt = ... # woodwork datatable as input to automl search, for example
numeric_features = dt.select('numeric')
categorical_features = dt.select('categorical')
natural_language_features = dt.select('natural_language')
# then, in order to drop unsupported types, from here on out, don't use
# the other features which may still be held in the original datatable
مثال بارز: تستخدم مجموعة بيانات الاحتيال خطوط الطول / العرض . حاليًا ، يتم تمرير ذلك في صورة طائرتين مستقلتين. على المدى القصير ، يجب أن نتراجع. أفترض أنه يمكننا الترميز إلى طائرتين مستقلتين ، لكني أشك في أن ذلك سيحقق أداءً جيدًا. على المدى الطويل ، سنرغب في استخدام العناصر الأولية المتوافقة مع أدوات Latlong لإنشاء ميزات لهذا النوع.
هذا معقول؟
أثارfreddyaboulton نقطة جيدة اليوم: نظرًا لأننا نشحن Evalml على conda ، فنحن بحاجة إلى أن تكون الأعمال الخشبية على conda قبل أن نتوقع أن يقوم المستخدمون بتثبيتها. يترك لنا ذلك الخيارات التالية لكيفية المتابعة:
fit
/ predict
، خاصة إذا كنا سنضيف أعمال خشبية إلى conda على أي حال ، لذلك يجب أن نتجنب ذلك.أنا معجب بالخيار 1 ، أي الحصول على أعمال خشبية في Conda ، لأنني أعتقد أن هذا ما نريد القيام به على المدى الطويل.
أرى أن هناك بالفعل مشكلة مرفوعة لإضافة الأعمال الخشبية إلى Conda. سأتابع.
dsherry شكرا لهذا! ذكر gsheni هنا أنه من المحتمل أن يكون لديهم تحديث قرب نهاية الأسبوع. هل يجب أن نؤجل الدمج لإصدار أكتوبر إذن؟
@ angela97lin ، حسنًا ، نظرًا لأن الإصدار في غضون أيام قليلة ، وأنك ستخرج قليلاً أيضًا ، فلن يكون هناك الكثير من المتاعب في انتظار الدمج حتى بعد ذلك.
كنت أتحدث مع @ angela97lin و freddyaboulton حول ترقية الأعمال الخشبية. إليك ما أدرجناه على أنه معلق حاليًا / على متن الطائرة:
transform
/ predict
، وفي أي مكان نعيد نسخة أو امتداد من البيانات التي أدخلها المستخدم.@ angela97lin هل فاتني أي شيء؟
dsherry هذا يبدو عن الحق!
transform
/ predict
، وفي أي مكان نعيد نسخة أو امتداد البيانات التي أدخلها المستخدم (# 1406)@ angela97lin رهيبة ، شكرا!
chukarstendsherry تم إغلاق كافة المشكلات المرتبطة بهذه الملحمة! هل من الآمن إغلاق هذه الملحمة وتتبع مشكلات الحرب العالمية الأولى التي تظهر بمعزل عن غيرها؟ :)