Derzeit prüfen wir nur, ob es sich bei einem Schätzer um die letzte Komponente handelt.
Die Pipeline bricht jedoch bei der Anpassung in der folgenden Zeile ohne Schätzer:
self.input_feature_names.update({self.estimator.name: list(pd.DataFrame(X_t))})
Wir sollten entweder erzwingen, dass alle Pipelines einen Schätzer haben müssen, oder _fit
, um diesen Fall zuzulassen.
Ich habe Nr. 273 eingereicht, um die Diskussion des langfristigen Plans zu verfolgen (dh wollen wir Pipelines mit mehr als einem Schätzer unterstützen? usw.).
Mein Vorschlag: Wir setzen die Diskussion dort fort, aber in der Zwischenzeit lösen wir dieses Ticket, indem wir den Fehler PipelineBase::__init__
ausgeben, wenn kein Schätzer als letzte Komponente angegeben ist. Erscheint das vernünftig?
Tagging @angela97lin @jeremyliweishih, weil wir das gerade in Slack diskutiert haben :)
das scheint vorerst eine vernünftige Lösung zu sein, bis wir den langfristigen Plan haben