Xgboost: Signification du score d'importance des caractéristiques

Créé le 30 mai 2015 · 4Commentaires · Source: dmlc/xgboost

Ont-ils une sémantique interprétable ? Comment sont-ils calculés ? Est-ce que plus haut veut dire mieux ?

Pour clarifier, j'utilise cls.booster().get_fscore() pour obtenir les scores.

Source

FabHan

👍2

Commentaire le plus utile

cela signifie que ces fonctionnalités ne sont jamais sélectionnées dans les arbres

tqchen le 2 juin 2015

👍2

Tous les 4 commentaires

De plus, get_fscore() renvoie moins de caractéristiques que le nombre de caractéristiques dans les données d'entraînement. J'ai 98 fonctionnalités et les scores de retour de get_fscores() de 71 fonctionnalités.

FabHan le 30 mai 2015

Plus il est élevé, mieux c'est, get_fscore renvoie le nombre d'occurrences de fonctionnalités dans l'ensemble

tqchen le 2 juin 2015

👍2

Utilise-t-il leurs niveaux dans l'arbre comme poids ?

Aussi, avez-vous une explication de la situation dans ma deuxième question?

Merci.

FabHan le 2 juin 2015

cela signifie que ces fonctionnalités ne sont jamais sélectionnées dans les arbres

tqchen le 2 juin 2015

👍2

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

La normalisation est-elle nécessaire ?

frankzhangrui · 3Commentaires

AttributeError : l'objet 'DMatrix' n'a pas d'attribut 'feature_names'

matthewmav · 3Commentaires

libpath['find_lib_path']() renvoie le chemin absolu de libxgboost.dll sous Windows ; l'installation de configuration échoue

Str1ker17 · 3Commentaires

Comment installer la version OpenMP dans R (Mac OS)

choushishi · 3Commentaires

Arrêt précoce avec métrique d'évaluation comme AUC

XiaoxiaoWang87 · 3Commentaires