Evalml: Interdire le rappel en tant qu'objectif automatique

Créé le 10 mars 2020 · 5Commentaires · Source: alteryx/evalml

Problème
Un modèle qui prédit toujours vrai a un score de rappel parfait. En permettant à automl d'optimiser le rappel, nous l'encourageons à produire un modèle trivial.

Référence utile ici .

Proposition
Supprimer l'objectif de rappel.

En général, nous devrions limiter l'ensemble d'objectifs automl à ceux que nous estimons utiles, et où l'optimisation pour ces objectifs produira de bons modèles.

Je pense que nous devrions également ajouter des objectifs de classification plus binaires. #457 inclut une proposition pour un qui pourrait être bon pour les classes déséquilibrées.

Des questions
* Un argument similaire peut-il être avancé pour la précision ? Ou y a-t-il une valeur à optimiser pour cela?
*Peut-on avancer un argument similaire pour la précision (#294) ?

@ angela97lin @ kmax12 Pour info

enhancement

Source

dsherry

👀1

Commentaire le plus utile

Je pense que la précision et l'exactitude sont bonnes dans le sens où elles ne vous donneront pas un modèle trivial.

nous ne voulons pas nécessairement supprimer le rappel en tant qu'objectif, il ne devrait tout simplement pas être optimisé par rapport à lui dans la recherche automatique. par exemple, je pourrais vouloir optimiser pour f1, mais ensuite voir mon score de rappel à côté de celui-ci

kmax12 le 10 mars 2020

👍2

Tous les 5 commentaires

Je pense que la précision et l'exactitude sont bonnes dans le sens où elles ne vous donneront pas un modèle trivial.

kmax12 le 10 mars 2020

👍2

@ kmax12 ouais, d'accord, nous ne voulons pas supprimer le code qui calcule le rappel, et nous voulons toujours prendre en charge le rappel informatique en tant que score sur un pipeline, mais nous voulons l'interdire en tant qu'objectif d'optimisation pris en charge dans automl.

Cela me rappelle la discussion en cours autour des méthodes de traçage/d'information de classification binaire pour le ROC et la matrice de confusion (#427, #365). Ce ne sont pas des métriques que nous pouvons optimiser dans automl, et ce ne sont pas non plus des scores à un seul chiffre, mais sous notre API, le moyen le plus simple de les définir était de les ajouter en tant qu'instances de ObjectiveBase .

Nous avons actuellement un certain nombre de choses qui peuvent être calculées à l'aide de pipelines :

Prédictions
Scores de fonction objectif pour automl
Métriques de notation, après automl
Tracé des données (exemple de classification binaire : courbe ROC, matrice de confusion)
Importance des fonctionnalités

Je pense qu'à ce jour, nous avons essayé d'utiliser ObjectiveBase pour représenter 2, 3 et 4. En d'autres termes, il nous manque une API claire pour définir les méthodes de notation et les méthodes de traçage, distinctes du processus automl .

Je pense que la prochaine étape ici devrait être de concevoir ces API. On dirait que j'ai déjà classé cela sous le numéro 392. Je mettrai à jour ce ticket pour être bloqué à ce sujet.

dsherry le 11 mars 2020

👍1

Pour la refonte de l'API des objectifs en ce moment, nous avons déplacé ROC et Confusion Matrix vers PlotMetrics la place (moins de conception a été consacrée à cela, c'était simplement le moyen le plus simple de séparer ces deux du reste des objectifs sans casser des choses). Nous avons également ajouté can_optimize_threshold comme attribut pour BinaryClassificationObjective , donc si fit() est appelé avec un objectif avec can_optimize_threshold=True alors nous optimisons pour cet objectif, sinon nous optimisons pour Précision. Des réflexions à ce sujet et comment cela pourrait-il s'aligner sur certaines des questions soulevées ici ? Serait-il difficile de savoir si un utilisateur a appelé fit sur Recall mais que nous avons plutôt optimisé pour Accuracy ?

angela97lin le 11 mars 2020

@angela97lin oui, je pense que retirer ROC/confusion de ObjectiveBase était une étape positive ! Je pense que #392 devrait aller plus loin. Continuons la conversation sur la façon de mettre à jour l'API sur #392 à la place. De cette façon, ce problème peut simplement suivre le rappel de mise à jour une fois que nous avons pris une décision sur la façon de gérer ces éléments de manière plus générale.

De plus, je pense que l'optimisation du seuil de classification binaire est un sujet distinct, et heureusement, votre travail en cours dans #346 gère 100 % !

dsherry le 11 mars 2020

Résumant la discussion avec @eccabay et @jeremyliweishih plus tôt : Les options pour soutenir ceci sont :

Supprimez entièrement les objectifs de rappel.
Supprimez les entrées pour les objectifs de rappel dans objectives/utils.py OPTIONS et confirmez que cela interdit ces objectifs dans automl.

dsherry le 19 mai 2020

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

Mauvaise performance sur l'ensemble de données de diamant

dsherry · 3Commentaires

build_conda_pkg échoue sur le principal

dsherry · 3Commentaires

Erreur lors de l'utilisation du rappel comme objectif automatique principal

npapan69 · 4Commentaires

BalancedClassificationDataCVSplit produit des divisions différentes à chaque appel

freddyaboulton · 3Commentaires

Avoir automl ajuste automatiquement le meilleur pipeline sur l'ensemble des données d'entraînement

dsherry · 3Commentaires