Ont-ils une sémantique interprétable ? Comment sont-ils calculés ? Est-ce que plus haut veut dire mieux ?
Pour clarifier, j'utilise cls.booster().get_fscore()
pour obtenir les scores.
De plus, get_fscore()
renvoie moins de caractéristiques que le nombre de caractéristiques dans les données d'entraînement. J'ai 98 fonctionnalités et les scores de retour de get_fscores()
de 71 fonctionnalités.
Plus il est élevé, mieux c'est, get_fscore renvoie le nombre d'occurrences de fonctionnalités dans l'ensemble
Utilise-t-il leurs niveaux dans l'arbre comme poids ?
Aussi, avez-vous une explication de la situation dans ma deuxième question?
Merci.
cela signifie que ces fonctionnalités ne sont jamais sélectionnées dans les arbres
Commentaire le plus utile
cela signifie que ces fonctionnalités ne sont jamais sélectionnées dans les arbres