Xgboost: Signification du score d'importance des caractéristiques

Créé le 30 mai 2015  ·  4Commentaires  ·  Source: dmlc/xgboost

Ont-ils une sémantique interprétable ? Comment sont-ils calculés ? Est-ce que plus haut veut dire mieux ?

Pour clarifier, j'utilise cls.booster().get_fscore() pour obtenir les scores.

Commentaire le plus utile

cela signifie que ces fonctionnalités ne sont jamais sélectionnées dans les arbres

Tous les 4 commentaires

De plus, get_fscore() renvoie moins de caractéristiques que le nombre de caractéristiques dans les données d'entraînement. J'ai 98 fonctionnalités et les scores de retour de get_fscores() de 71 fonctionnalités.

Plus il est élevé, mieux c'est, get_fscore renvoie le nombre d'occurrences de fonctionnalités dans l'ensemble

Utilise-t-il leurs niveaux dans l'arbre comme poids ?

Aussi, avez-vous une explication de la situation dans ma deuxième question?

Merci.

cela signifie que ces fonctionnalités ne sont jamais sélectionnées dans les arbres

Cette page vous a été utile?
0 / 5 - 0 notes