Die Validierung von Feature-Namen kann zwar in einigen Fällen hilfreich sein, bringt aber auch Probleme mit sich, wenn die neuen Daten das entsprechende Feature nicht enthalten. Dies kann bei spärlichen Daten häufig vorkommen und ist nicht das gewünschte Verhalten. Die häufige Überprüfung von Featurenamen schadet auch der Geschwindigkeit während der Trainingsphase, wenn die Daten spärlich sind.
Ich würde vorschlagen, die Funktionsnamenvalidierung zu entfernen und optional zu machen. Ich würde gerne Konsequenzen verstehen und sehen, ob die eine PR darüber machen wollen. @sinhrks @terrytangyuan @phunterlau
Ich hoffe, wir können https://github.com/dmlc/xgboost/issues/1238 vollständig lösen und Regressionstests hinzufügen, um dies zu verhindern
Ich stimme dieser Änderung zu.
Ich habe in letzter Zeit nicht viel Freizeit, um dies zu veröffentlichen, aber ich denke, es sollte ziemlich einfach sein, dies optional zu machen.
Ich denke jedoch, dass es nicht notwendig ist, es bei jedem Update- und Boost- Aufruf zu validieren. Ich habe das Gefühl, dass wir es nur einmal während der Initialisierung von DMatrix
und Booster
validieren müssen. Wir sollten die Benutzer auf jeden Fall explizit auf die Konsequenzen und Kompromisse des Überspringens von Validierungen hinweisen.
Ist das gelöst?
dito. warten darauf, dass dies gelöst wird. läuft immer noch 0.4a30
...
Schließung, da #3323 dieses Problem behebt.
Hilfreichster Kommentar
Ich stimme dieser Änderung zu.
Ich habe in letzter Zeit nicht viel Freizeit, um dies zu veröffentlichen, aber ich denke, es sollte ziemlich einfach sein, dies optional zu machen.
Ich denke jedoch, dass es nicht notwendig ist, es bei jedem Update- und Boost- Aufruf zu validieren. Ich habe das Gefühl, dass wir es nur einmal während der Initialisierung von
DMatrix
undBooster
validieren müssen. Wir sollten die Benutzer auf jeden Fall explizit auf die Konsequenzen und Kompromisse des Überspringens von Validierungen hinweisen.