Xgboost: [PYTHON] Validierung des Funktionsnamens optional machen

Erstellt am 22. Sept. 2016 · 4Kommentare · Quelle: dmlc/xgboost

Die Validierung von Feature-Namen kann zwar in einigen Fällen hilfreich sein, bringt aber auch Probleme mit sich, wenn die neuen Daten das entsprechende Feature nicht enthalten. Dies kann bei spärlichen Daten häufig vorkommen und ist nicht das gewünschte Verhalten. Die häufige Überprüfung von Featurenamen schadet auch der Geschwindigkeit während der Trainingsphase, wenn die Daten spärlich sind.

Ich würde vorschlagen, die Funktionsnamenvalidierung zu entfernen und optional zu machen. Ich würde gerne Konsequenzen verstehen und sehen, ob die eine PR darüber machen wollen. @sinhrks @terrytangyuan @phunterlau

Ich hoffe, wir können https://github.com/dmlc/xgboost/issues/1238 vollständig lösen und Regressionstests hinzufügen, um dies zu verhindern

Quelle

tqchen

👍2

Hilfreichster Kommentar

Ich stimme dieser Änderung zu.

Ich habe in letzter Zeit nicht viel Freizeit, um dies zu veröffentlichen, aber ich denke, es sollte ziemlich einfach sein, dies optional zu machen.

Ich denke jedoch, dass es nicht notwendig ist, es bei jedem Update- und Boost- Aufruf zu validieren. Ich habe das Gefühl, dass wir es nur einmal während der Initialisierung von DMatrix und Booster validieren müssen. Wir sollten die Benutzer auf jeden Fall explizit auf die Konsequenzen und Kompromisse des Überspringens von Validierungen hinweisen.