Actuellement, nous vérifions uniquement que s'il existe un estimateur, il s'agit de la dernière composante.
Cependant, le pipeline se rompt lors de l'ajustement sur la ligne suivante sans estimateur :
self.input_feature_names.update({self.estimator.name: list(pd.DataFrame(X_t))})
Nous devons soit imposer que tous les pipelines doivent avoir un estimateur, soit corriger _fit
pour permettre ce cas.
J'ai déposé le numéro 273 pour suivre la discussion du plan à long terme autour de cela (c'est-à-dire, voulons-nous prendre en charge les pipelines avec plus d'un estimateur? etc.).
Ma suggestion : nous continuons la discussion là-bas, mais en attendant, nous résolvons ce ticket en faisant sortir l'erreur PipelineBase::__init__
si un estimateur n'est pas spécifié comme composant final. Cela vous semble-t-il raisonnable ?
Tagging @angela97lin @jeremyliweishih parce que nous venons juste d'en discuter en mou :)
cela semble être une solution raisonnable pour l'instant jusqu'à ce que nous ayons le plan à long terme