Scikit-learn: Suggestion : Supprimez la prédiction de plot_confusion_matrix et transmettez simplement les étiquettes prédites

Créé le 13 déc. 2019 · 61Commentaires · Source: scikit-learn/scikit-learn

La signature de plot_confusion_matrix est actuellement :

sklearn.metrics.plot_confusion_matrix(estimator, X, y_true, labels=None, sample_weight=None, normalize=None, display_labels=None, include_values=True, xticks_rotation='horizontal', values_format=None, cmap='viridis', ax=None)

La fonction prend un estimateur et des données brutes et ne peut pas être utilisée avec des étiquettes déjà prédites. Cela a quelques inconvénients:

Si une matrice de confusion doit être tracée mais que les prédictions doivent également être utilisées ailleurs (par exemple, le calcul de precision_score), l'estimation doit être effectuée plusieurs fois. Cela prend plus de temps et peut donner des valeurs différentes si l'estimateur est randomisé.
Si aucun estimateur n'est disponible (par exemple des prédictions chargées à partir d'un fichier), le tracé ne peut pas du tout être utilisé.

Suggestion : autorisez le passage des étiquettes prédites y_pred à plot_confusion_matrix qui seront utilisées à la place de estimator et X . À mon avis, la solution la plus propre serait de supprimer l'étape de prédiction de la fonction et d'utiliser une signature similaire à celle de accuracy_score , par exemple (y_true, y_pred, labels=None, sample_weight=None, ...) . Cependant, afin de maintenir la compatibilité descendante, y_pred peut être ajouté comme argument de mot-clé facultatif.

model_selection

Source

jhennrich

👍2

Tous les 61 commentaires

Nous devrions certainement rester rétrocompatibles, mais l'ajout d'un argument de mot-clé y_pred me semble raisonnable. Nous devrions générer une erreur si y_pred est passé mais que X ou l'estimateur sont également passés.

Souhaitez-vous soumettre un PR @jhennrich ?

NicolasHug le 13 déc. 2019

J'ai soumis un PR, mais je pense qu'il y a actuellement un problème avec le CI donc il n'est pas encore passé.

jhennrich le 13 déc. 2019

Je suis d'accord que nous devrions prendre en charge plot_XXX(y_true, y_pred) pour éviter de calculer la prédiction plusieurs fois.
Nous avons également des problèmes similaires dans plot_roc_curve et plot_precision_recall_curve.
L'ajout de y_pred semble acceptable, mais honnêtement, je ne pense pas que ce soit une bonne solution.
Pour les fonctions qui acceptent **kwargs (par exemple, plot_precision_recall_curve), semble-t-il impossible de rester rétrocompatible ?

qinhanmin2014 le 13 déc. 2019

Pourquoi est-il impossible de conserver la rétrocompatibilité ? Il me semble que la proposition en #15883 est OK

NicolasHug le 13 déc. 2019

Pourquoi est-il impossible de conserver la rétrocompatibilité ? Il me semble que la proposition en #15883 est OK

car nous ne prenons pas en charge **kwargs dans plot_confusion_matrix. @NicolasHug

qinhanmin2014 le 13 déc. 2019

Pourquoi kwargs est-il un problème ?

NicolasHug le 13 déc. 2019

Hmm, donc il y a une autre chose ennuyeuse, nous supportons **kwargs dans plot_roc_curve et plot_precision_recall_curve (et plot_partial_dependence), mais nous ne le supportons pas dans plot_confusion_matrix

qinhanmin2014 le 13 déc. 2019

Pourquoi kwargs est-il un problème ?

si nous ajoutons le nouveau paramètre avant **kwargs, nous pouvons conserver la compatibilité descendante, n'est-ce pas ?

qinhanmin2014 le 13 déc. 2019

Les modifications apportées à mon PR sont rétrocompatibles et **kwargs peut toujours être ajouté. Mais je suis d'accord avec @qinhanmin2014 , une solution beaucoup plus propre serait de jeter estimator et X et d'utiliser des arguments positionnels (y_true, y_pred, ...) qui sont cohérents avec la plupart des d'autres trucs sklearn.

jhennrich le 13 déc. 2019

si nous ajoutons le nouveau paramètre avant **kwargs, nous pouvons conserver la compatibilité descendante, n'est-ce pas ?

Oui

une solution beaucoup plus propre....

Malheureusement, cela nécessiterait un cycle de dépréciation (à moins que nous ne le rendions très rapide dans la version de correction de bogues, mais j'en doute...)

@thomasjpfan , une raison de passer l'estimateur en entrée au lieu des prédictions ?

NicolasHug le 13 déc. 2019

Merci, ajoutons d'abord y_pred, **kwags est un autre problème.

qinhanmin2014 le 13 déc. 2019

Malheureusement, cela nécessiterait un cycle de dépréciation (à moins que nous ne le rendions très rapide dans la version de correction de bogues, mais j'en doute...)

Cela semble impossible, soupir

@thomasjpfan , une raison de passer l'estimateur en entrée au lieu des prédictions ?

Je suis d'accord que nous devons reconsidérer la conception de notre API. essaie aussi de ping @amueller

qinhanmin2014 le 13 déc. 2019

Si un utilisateur souhaite fournir sa propre partie de traçage et fournir sa propre matrice de confusion :

from sklearn.metrics import ConfusionMatrixDisplay
confusion_matrix = confusion_matrix(...)
display_labels = [...]

disp = ConfusionMatrixDisplay(confusion_matrix=confusion_matrix,
                              display_labels=display_labels)
disp.plot(...)

Cela peut être fait de la même manière pour les autres fonctions de traçage métrique.

Le plot_confusion_matrix est en quelque sorte conçu comme les scoreurs qui sont capables de gérer correctement la sortie des estimateurs. En d'autres termes, il s'agit d'un wrapper pratique pour interagir avec ConfusionMatrixDisplay et l'estimateur.

thomasjpfan le 13 déc. 2019

En acceptant d'abord l'estimateur, il existe une interface uniforme pour les fonctions de tracé. Par exemple, le plot_partial_dependence effectue tous les calculs nécessaires à la création des tracés de dépendance partielle et les transmet à PartialDependenceDisplay . Un utilisateur peut toujours créer le PartialDependenceDisplay même, mais dans ce cas, il serait plus impliqué.

thomasjpfan le 13 déc. 2019

Bien que je sois ouvert à avoir un "chemin rapide", permettant à y_pred d'être transmis aux fonctions de traçage liées aux métriques, qui seront directement transmises à confusion_matrix et le laissera s'occuper de la validation.

thomasjpfan le 13 déc. 2019

Le calcul des prédictions nécessaires pour construire un PDP est assez complexe. De plus, ces prédictions sont généralement inutilisables dans, par exemple, un marqueur ou une métrique. Ils ne sont utiles que pour tracer le PDP. Il est donc logique dans ce cas de n'accepter que l'estimateur dans plot_partial_dependence.

OTOH pour matrice de confusion, les prédictions ne sont en réalité que est.predict(X) .

Je ne pense pas que nous voulions une interface uniforme ici. Ce sont 2 cas d'utilisation d'entrée très différents

EDIT : De plus, les PDP basés sur des arbres n'ont même pas besoin de prédictions du tout

NicolasHug le 13 déc. 2019

Il y a d'autres choses que nous rencontrerons sans l'estimateur. Par exemple, si plot_precision_recall_curve accepte y_pred , il aura besoin de pos_label car il ne peut plus être déduit. Dans ce cas, je préférerais utiliser directement PrecisionRecallDisplay et demander à l'utilisateur de calculer les paramètres nécessaires pour reconstruire le tracé.

Cela revient à quel genre de question nous répondons avec cette API. L'interface actuelle tourne autour de l'évaluation d'un estimateur, utilisant ainsi l'estimateur comme argument. Il est motivé par la réponse « comment ce modèle entraîné se comporte-t-il avec ces données d'entrée ? »

Si nous acceptons y_pred, y_true , la question devient alors "comment cette métrique se comporte-t-elle avec ces données ?" Ces données peuvent ou non être générées par un modèle.

thomasjpfan le 13 déc. 2019

Il est vrai que dans ce cas précis, @jhennrich vous pourriez directement utiliser le ConfusionMatrixDisplay.

Un inconvénient est que vous devez spécifier display_labels car il n'a pas de valeur par défaut.

@thomasjpfan pensez -vous que nous pourrions en général fournir des valeurs par défaut sensées pour les objets d'affichage, rendant ainsi toujours pratique l'utilisation directe des objets d'affichage ?

NicolasHug le 13 déc. 2019

Pour certains paramètres, comme display_labels , il existe une valeur par défaut raisonnable. Les autres paramètres de l'objet Display peuvent également avoir des valeurs par défaut raisonnables. Certains paramètres doivent cependant être fournis. Par exemple, confusion_matrix doit être fourni pour ConfusionMatrixDisplay ou precision et recall pour PrecisionRecallDisplay .

thomasjpfan le 13 déc. 2019

Un modèle classique pour ce genre de chose définit :

ConfusionMatrixDisplay.from_estimator(...)
ConfusionMatrixDisplay.from_predictions(...)

mais ce n'est pas très idiomatique à scikit-learn.

jnothman le 16 déc. 2019

🎉1

Je commence à être confus. L'objectif de l'API actuelle est d'éviter de calculer plusieurs fois si les utilisateurs souhaitent tracer plusieurs fois, mais si nous acceptons y_true et y_pred, les utilisateurs n'ont toujours pas besoin de calculer plusieurs fois ? (Je sais que les choses sont différentes dans PDP)

qinhanmin2014 le 16 déc. 2019

@jnothman Cette API est plutôt jolie !

@qinhanmin2014 Passer un estimator, X, y ou y_true, y_pred fonctionne en satisfaisant l'API "ne pas calculer plusieurs fois". Dans les deux cas, la matrice de confusion est calculée et stockée dans l'objet Display .

La différence entre eux est l'endroit où commence le calcul de la matrice de confusion. On peut considérer passer y_pred comme la valeur "précalculée" de l'estimateur.

thomasjpfan le 16 déc. 2019

Donc je pense que y_true, y_pred est meilleur que estimator, X, y (pas dans PDP bien sûr), parce que parfois (souvent ?) les utilisateurs veulent non seulement tracer les prédictions, mais aussi analyser les prédictions. Avec l'API actuelle, ils devront calculer les prédictions plusieurs fois.

qinhanmin2014 le 16 déc. 2019

Pour les métriques, je peux voir la préférence pour l'utilisation de y_true, y_pred sur estimator, X, y . Imaginez si le tracé des métriques ne prend en charge que y_true, y_pred

est = # fit estimator

plot_partial_dependence(est, X, ...)

# if plot_confusion_matrix accepts `y_true, y_pred`
y_pred = est.predict(X)
plot_confusion_matrix(y_true, y_pred, ...)

# if plot_roc_curve supports `y_true, y_score`
y_score = est.predict_proba(X)[: , 1]
plot_roc_curve(y_true, y_score, ...)
plot_precision_recall_curve(y_true, y_score, ...)

Actuellement, l'API ressemble à :

est = # fit estimator
plot_partial_dependence(est, X, ...)
plot_confusion_matrix(est, X, y, ...)
plot_roc_curve(est, X, y, ...)

# this will call `predict_proba` again
plot_precision_recall_curve(est, X, y, ...)

Je préférerais avoir une API qui prend en charge les deux options (d'une manière ou d'une autre).

thomasjpfan le 16 déc. 2019

Pour les métriques, je peux voir la préférence pour l'utilisation de y_true, y_pred par rapport à l'estimateur, X, y. Imaginez si le tracé des métriques ne prend en charge que y_true, y_pred

Oui, c'est ce que je veux dire.

Je préférerais avoir une API qui prend en charge les deux options (d'une manière ou d'une autre).

Je pense que c'est une solution pratique. Une chose ennuyeuse est que nous ne pouvons ajouter y_pred qu'à la fin (c'est-à-dire plot_confusion_matrix(estimator, X, y_true, ..., y_pred))

qinhanmin2014 le 16 déc. 2019

Oui, ce sera à la fin et l'API ressemblera à ceci :

plot_confusion_matrix(y_true=y_true, y_pred=y_pred, ...)

avec lequel je pense que je suis d'accord. Il s'agit essentiellement du PR https://github.com/scikit-learn/scikit-learn/pull/15883

thomasjpfan le 16 déc. 2019

Oui ce sera à la fin et l'API ressemblerait à ceci plot_confusion_matrix(y_true=y_true, y_pred=y_pred, ...)

Je suppose que vous voulez dire que nous devrions ajouter y_true et supprimer est & X, n'est-ce pas ? Je suppose que c'est impossible ? (car on ne peut ajouter y_pred qu'à la fin)

qinhanmin2014 le 18 déc. 2019

Voulons-nous résoudre cela en 0.22.1 ? @NicolasHug @thomasjfox Je pense que cela vaut la peine de mettre cela dans 0.22.1, mais en même temps, il semble que ce soit une nouvelle fonctionnalité.

qinhanmin2014 le 18 déc. 2019

Non, ne le mettez pas en 0.22.1. c'est une violation claire de sever

jnothman le 18 déc. 2019

@qinhanmin2014 Ajouter y_pred à la fin ou supprimer est, X semble être une nouvelle fonctionnalité qui appartient à la prochaine version.

Je suppose que vous voulez dire que nous devrions ajouter y_true et supprimer est & X, n'est-ce pas ? Je suppose que c'est impossible ?

En fin de compte, je préférerais prendre en charge les deux interfaces, car elles ont des cas d'utilisation légèrement différents.

est, X est plus facile à faire une analyse rapide, car la fonction gère le choix de la fonction de réponse, le découpage du résultat et sa transmission à la métrique.
y_true, y_pred est destiné aux utilisateurs qui comprennent comment utiliser la métrique sous-jacente et qui ont déjà enregistré les prédictions.

thomasjpfan le 18 déc. 2019

Quel est le problème avec https://github.com/scikit-learn/scikit-learn/issues/15880#issuecomment -565489619 ?

Je n'ai pas lu tout ce fil mais si nous autorisons l'interface ici, nous devons également le faire pour plot_roc_curve où l'interface sera assez différente entre fournir des prédictions et fournir l'estimateur (l'un a besoin de pos_label l'autre ne 't).
Je pense donc qu'autoriser les deux dans la même interface est une mauvaise idée (quelqu'un passera pos_label lors du passage d'un estimateur et obtiendra un résultat auquel il ne s'attend pas).

ConfusionMatrixDisplay.from_estimator(...)
ConfusionMatrixDisplay.from_predictions(...)

Cela pourrait fonctionner, mais cela rendrait le plot_confusion_matrix redondant, et donc nous supprimerions à nouveau les fonctions et modifierions les responsabilités entre la classe et la fonction (nous avons dit que la classe ne fait pas le calcul).

Si nous voulons ajouter un from_predictions à plot_roc_curve il doit essentiellement refléter parfaitement l'interface roc_curve . Donc, je ne pense pas qu'il soit trop mauvais de demander à l'utilisateur d'appeler directement la fonction roc_curve , puis de transmettre les résultats à l'objet Display.

Tout le but de la conception des objets d'affichage était de permettre le cas d'utilisation mentionné par @jhennrich et pourquoi nous avons séparé le calcul de la fonction. Je n'ai pas encore vu d'argument expliquant pourquoi nous devrions revenir sur cette décision.

amueller le 18 déc. 2019

@amueller Techniquement, vous avez raison, la solution actuelle à mon problème consiste simplement à utiliser ConfusionMatrixDisplay . Cependant il est vraiment maladroit à utiliser :

vous devez passer les étiquettes explicitement
vous devez d'abord calculer la matrice de confusion
vous devez créer un objet de la classe et ensuite appeler la méthode plot

Pour toutes les applications, je peux penser à une signature plot_confusion_matrix avec (y_true, y_pred, ...) serait beaucoup plus pratique que ce que nous avons actuellement. À mon avis, il existe beaucoup plus de cas d'utilisation dans lesquels vous souhaitez calculer explicitement les prédictions (bien que je sois sûr que mon point de vue est biaisé).

Si vous avez une signature plot_confusion_matrix(y_true, y_pred) et que vous voulez réellement l'utiliser sur des données estimator , x , y , il n'y a que très peu de code supplémentaire à écrire : plot_confusion_matrix(y, estimator.predict(x)) .
En comparaison, si vous avez la signature actuelle et que vous souhaitez tracer à partir de y_true et y_pred , vous devez écrire beaucoup plus de code.

À mon avis, la signature plot_confusion_matrix(y_true, y_pred) devrait être par défaut et une autre fonction qui prend estimator , x , y devrait être construite par dessus.

Enfin, honnêtement, je ne comprends pas vraiment l'idée derrière la classe ConfusionMatrixDisplay . La fonction n'a qu'un seul constructeur et exactement une méthode, donc chaque fois que vous l'utilisez, vous finissez par créer une instance et appeler la fonction plot . Je ne vois pas pourquoi cela devrait être une classe et pas seulement une fonction. Il existe également d'autres classes *Display (PrecisionRecall, ROC, ...), mais leurs signatures constructeur et plot() sont complètement différentes, elles ne peuvent donc pas être échangées de toute façon.
Peut-être que cela dépasse le cadre de ce problème.

jhennrich le 19 déc. 2019

@jhennrich

Si vous avez une signature plot_confusion_matrix(y_true, y_pred) et que vous souhaitez réellement l'utiliser sur l'estimateur, les données x, y, il n'y a que très peu de code supplémentaire à écrire : plot_confusion_matrix(y, estimator.predict(x)).

Pour le cas de la matrice de confusion, il est simple de passer estimator.predict si on avait une interface y_true, y_pred . D'un autre côté, pour plot_roc_auc , l'utilisateur aurait besoin de faire du slicing :

y_pred = est.predict_proba(X)
plot_roc_curve(y_true, y_pred[:, 1])

# or
y_pred = est.decision_function(X)
plot_roc_curve(y_true, y_pred[:, 1])

Enfin, honnêtement, je ne comprends pas vraiment l'idée derrière la classe ConfusionMatrixDisplay. La fonction n'a qu'un seul constructeur et exactement une méthode, donc chaque fois que vous l'utilisez, vous finissez par créer une instance et appeler la fonction plot. Je ne vois pas pourquoi cela devrait être une classe et pas seulement une fonction.

Le but des objets Display est de stocker les valeurs calculées permettant aux utilisateurs d'appeler plot plusieurs fois sans recalculer. Cela peut être vu en utilisant plot_partial_dependence :

# Does expensive computation
disp = plot_partial_dependence(est, ...)

# change line color without needing to recompute partial dependence
disp.plot(line_kw={"c": "red"})

Honnêtement, je suis sur la clôture sur cette question. Je suis +0,1 pour me déplacer vers la copie de l'interface des métriques pour le traçage des métriques et la suppression de l'interface est, X, y . :/

thomasjpfan le 19 déc. 2019

Pour le cas de la matrice de confusion, il est simple de passer dans estimateur.predict si on avait une interface y_true, y_pred. En revanche, pour plot_roc_auc, l'utilisateur aurait besoin de faire du slicing :

Oui, mais ce faisant, nous évitons de calculer la prédiction plusieurs fois (bien que la prédiction ne soit souvent pas si chère)

Peut-être qu'une solution pratique consiste à prendre en charge y_true, y_pred dans plot_XXX (le cas échéant) en 0.23.

qinhanmin2014 le 27 déc. 2019

@jhennrich Comment allez-vous faire cela sans passer explicitement les étiquettes? Si les étiquettes peuvent être déduites de ce qui est donné, confusion_matrix fera pour vous.

Mais effectivement tu as raison, c'est trois lignes au lieu d'une.

Dans le cas de confusion_matrix, j'ai tendance à convenir que le cas le plus courant pourrait être le passage de y_true et y_pred .
La raison pour laquelle l'interface est actuellement telle qu'elle est est d'être cohérente avec les autres fonctions de traçage métrique. Comme l'a dit @thomasjpfan , la courbe roc est moins évidente à tracer.

À l'heure actuelle, le code pour tracer une matrice de confusion et tracer une courbe roc est le même. Avec la modification que vous suggérez, ils ne seront plus les mêmes et il n'y aura pas de moyen facile de les rendre identiques.

La question est de savoir si dans ce cas il est préférable d'avoir des interfaces cohérentes ou d'avoir une interface simple.
@jhennrich Pour moi, la vraie question est de savoir quelle est la bonne interface pour plot_roc_curve . Avez-vous des idées là-dessus?

@thomasjpfan penchez -vous également pour prendre y_store pour tracer roc auc?

Il y a certainement des avantages et des inconvénients à utiliser l'interface de score au lieu d'utiliser l'interface métrique. Mais pour des choses plus complexes, il est beaucoup plus sûr d'utiliser l'interface de score.

@qinhanmin2014
Je pense que ce serait bien d'ajouter y_pred à plot_confusion_matrix . La question est de savoir si nous voulons ajouter y_score à plot_roc_curve et plot_precision_recall_curve . Si nous le faisons, nous devons également ajouter pos_label comme je l'ai dit plus haut, et les choses deviendront plus compliquées.

Je vois trois façons de s'en sortir :
a) Ajoutez seulement y_pred à plot_confusion_matrix , mais n'ajoutez pas y_score à plot_roc_curve etc. Inconvénient : le problème d'appeler predict_proba plusieurs fois continue d'exister pour ces métriques.
b) Facilitez l'utilisation directe de l'objet Display (bien que je ne sache pas vraiment comment).
c) Ajoutez une autre méthode ou fonction qui reflète l'interface métrique. Inconvénient : plus grande surface API.

Je ne pense pas que le fait que la fonction plot_X reflète à la fois l'interface de score et l'interface métrique soit une bonne idée en général.

amueller le 27 déc. 2019

Je pense que ce serait formidable de résoudre ce problème d'une manière ou d'une autre @adrinjalali voulez-vous en discuter lors de la prochaine réunion peut-être ?

amueller le 20 févr. 2020

J'ai parfois des cauchemars à ce sujet. Peut-être pouvons-nous ajouter une méthode statique qui prend directement la sortie de la métrique :

result = confusion_matrix(...)
ConfusionMatrixDisplay.from_metric(result).plot()

Pour la courbe roc :

result = roc_curve(...)
RocCurveDisplay.from_metric(*result).plot()

En passant, en regardant les bases de code, je pense que plus d'utilisateurs sont familiers avec l'interface de métriques que l'interface de score.

thomasjpfan le 21 févr. 2020

J'ai parfois des cauchemars à ce sujet.

Oh non :(

En passant, en regardant les bases de code, je pense que plus d'utilisateurs sont familiers avec l'interface de métriques que l'interface de score.

Je pense que c'est certainement vrai. Mais je suis également tout à fait certain que les gens utilisent y_pred alors qu'ils devraient utiliser y_score et obtiennent de mauvais résultats parce que l'interface ne vous dit pas que vous devez faire quelque chose de différent et non- on lit jamais les docs.

Je ne sais pas en quoi la méthode statique que vous proposez est différente du constructeur, mais j'oublie peut-être quelque chose.

amueller le 21 févr. 2020

Salut, je viens de voter pour le problème - en tant qu'utilisateur de longue date de sklearn, j'ai trouvé l'API actuelle pour plot_confusion_matrix très... eh bien, déroutante. J'aime beaucoup son ajout (moins de copier-coller), mais les fonctions de métriques ont toujours utilisé le schéma (y_true, y_pred) qui est juste plus flexible et auquel j'ai déjà été habitué.

Dans mon cas, cela n'a pas de sens de transmettre un estimateur, car c'est un modèle très lent et je préfère charger les prédictions à partir d'un fichier que de le réexécuter chaque fois que je veux analyser les résultats. Je suis heureux d'avoir découvert dans ce fil qu'il existe une solution de contournement à l'aide de l'objet * Display, mais sa capacité de découverte n'est pas excellente - je suggérerais au moins de l'ajouter à la documentation plot_confusion_matrix ou peut-être au guide de l'utilisateur de la matrice de confusion ?

pzelasko le 21 mars 2020

Dans mon cas, cela n'a pas de sens de passer un estimateur, car c'est un modèle très lent et je préfère charger les prédictions

Merci pour votre contribution. Si l'API actuelle prête à confusion, il serait de plus en plus logique de passer à une interface de type API de métriques et de traverser un cycle de dépréciation douloureux.

La plus grande préoccupation que nous avons avec l'utilisation de l'interface des métriques est :

Mais je suis également certain que les gens utilisent y_pred alors qu'ils devraient utiliser y_score et obtiennent de mauvais résultats parce que l'interface ne vous dit pas que vous devez faire quelque chose de différent et que personne ne lit jamais les documents.

@pzelasko Que

thomasjpfan le 5 avr. 2020

@thomasjpfan Je comprends le problème, c'est un problème difficile. Peut-être qu'un compromis raisonnable serait de n'autoriser que les arguments de mot-clé pour cette fonction (maintenant que vous n'avez plus besoin de prendre en charge Python 2) ? Comme : def plot_confusion_matrix(*, y_true, y_pred, ...) . C'est toujours différent du reste des métriques, mais 1) il a une bonne raison pour cela, 2) il utilise au moins le même type d'entrées que les autres fonctions.

Quoi qu'il en soit, je sais pourquoi vous hésitez à apporter des modifications à l'API, c'est pourquoi j'ai suggéré de mentionner au moins la solution de contournement dans la documentation. (En fait, je les ai lus plusieurs fois et je les apprécie vraiment !)

pzelasko le 5 avr. 2020

La façon actuelle d'utiliser y_true et y_pred est indiquée ici : https://scikit-learn.org/stable/auto_examples/miscellaneous/plot_display_object_visualization.html#create -confusionmatrixdisplay

Je sais que je m'étire ici, mais qu'en est-il de ceci :

plot_confusion_matrix(estimator='precomputed', y_true, y_pred, ...)

où la deuxième position accepte y_true comme prédictions si estimator='precomputed .

thomasjpfan le 10 juil. 2020

👍1

si vous voulez vous étirer encore plus, je préférerais plot_confusion_matrix((estimator, X, y), ...) ou plot_confusion_matrix((y_true, y_pred), ...) mais je ne suis pas sûr que cela résolve les problèmes soulevés par

glemaitre le 7 août 2020

Il existe quelques nouveaux utilitaires de traçage où autoriser une API metric aurait vraiment du sens :

plot_prediction_error dans https://github.com/scikit-learn/scikit-learn/pull/18020
plot_calibration_curve dans https://github.com/scikit-learn/scikit-learn/pull/17443 (CC @lucyleeow )

Je comprends le problème mentionné par @amueller concernant la nécessité de transmettre pos_label etc., mais ce n'est un problème pour aucune des fonctions susmentionnées.

Sommes-nous d'accord pour prendre en charge à la fois l'API des marqueurs et des métriques pour ces deux ? Nous n'avons pas à nous soucier de la compatibilité descendante là-bas.

NicolasHug le 14 août 2020

👀1

Je suis toujours pour ma suggestion d'utiliser precomputed , que nous utilisons couramment dans nos estimateurs. Dans ce cas, la signature serait :

plot_confusion_matrix(estimator='precomputed', y_true, y_pred, ..., metric_kwargs=None)

Je vais mettre en place des relations publiques pour voir à quoi cela ressemble.

thomasjpfan le 14 août 2020

Je ne parle pas encore vraiment de l'API, je demande seulement si nous sommes d'accord pour prendre en charge les deux options pour les nouveaux PR.

(Mais en ce qui concerne l'API, je ne pense pas que 'précalculé' aide beaucoup: que faisons-nous à propos de X ? Je pense que nous devrions simplement garder (y_pred) et (estimateur, X) mutuellement exclusifs, en faisant correctement une erreur . Qu'est-ce que cela signifie également pour un estimateur d'être précalculé ?)

NicolasHug le 14 août 2020

Ou estimator='none' , estimator='predictions' , estimator='precomputed_predictions' , puis X devient y_pred ou y_score . C'est presque comme la façon dont nous gérons les distances précalculées avec X dans les estimateurs.

Sommes-nous d'accord pour prendre en charge à la fois l'API des marqueurs et des métriques pour ces deux ?

Comment allons-nous soutenir les deux options? Avec deux fonctions ?

j'aurais aimé aussi :

CalibrationDisplay.from_estimator(...)
CalibrationDisplay.from_predictions(...)

ce qui serait deux méthodes.

thomasjpfan le 14 août 2020

La suggestion de Guillaume d'utiliser des tuples https://github.com/scikit-learn/scikit-learn/issues/15880#issuecomment -670590882 est une option. Je pense que cela aurait été la meilleure option si nous étions partis de là depuis le début. Mais je crains que l'utilisation de tuples ne rompe la cohérence avec les utilitaires existants.

plot_XYZ(estimator=None, X=None, y=None, y_pred=None) avec exclusion mutuelle est une autre option, et c'est celle que je défends, pour l'instant.

J'aime CalibrationDisplay.from_estimator(...) , mais comme Andy l'a noté, nous devrions alors supprimer les fonctions plot_XYZ . Cela vaut peut-être le coup d'y réfléchir.

NicolasHug le 14 août 2020

Je pense que nous pouvons passer aux tuples et déprécier le comportement actuel. (Tant que nous acceptons d'utiliser des tuples)

thomasjpfan le 14 août 2020

Cela ressemble donc à une discussion sur les espaces de noms, n'est-ce pas ?
Que nous ayons une fonction et un constructeur, ou deux méthodes de classe, ou deux fonctions, c'est exactement la même fonctionnalité et fondamentalement le même code.

@pzelasko @jhennrich que

Et si vous préférez deux fonctions ou deux méthodes de classe, voyez-vous un avantage malgré la découvrabilité ? La découvrabilité pourrait être une raison suffisante pour faire des classmethods, je ne vois pas d'argument solide pour avoir deux fonctions.

amueller le 31 août 2020

Pourrions-nous ajouter l'étiquette de bloqueur ici ? Il semble que cela empêche de progresser sur les #18020 et #17443 (cc @cmarmo)

lucyleeow le 10 sept. 2020

L'étiquette de bloqueur est pour les bloqueurs de version (choses qui doivent absolument être corrigées avant une version), pas pour les bloqueurs de relations publiques

NicolasHug le 10 sept. 2020

👍1

Ahh bon à savoir.

lucyleeow le 10 sept. 2020

@pzelasko @jhennrich que
Et si vous préférez deux fonctions ou deux méthodes de classe, voyez-vous un avantage malgré la découvrabilité ? La découvrabilité pourrait être une raison suffisante pour faire des classmethods, je ne vois pas d'argument solide pour avoir deux fonctions.

J'aime le plus l'approche à deux classes, en particulier le modèle from_xxx - quelque chose comme @thomasjpfan proposé :

CalibrationDisplay.from_estimator(...)
CalibrationDisplay.from_predictions(...)

pzelasko le 10 sept. 2020

On dirait qu'il n'y a pas de forte opposition à l'utilisation de méthodes de classe 2, alors faisons-le. Nous devrons :

Présentez les méthodes de classe pour les parcelles actuellement existantes :
- ConfusionMatrixDisplay
- PrecisionRecallDisplay
- RocCurveDisplay
- DetCurveDisplay
- PartialDependenceDisplay . Pour celui-ci, nous ne voulons pas introduire la méthode from_predictions classe from_estimator .
Pour tous les écrans répertoriés ci-dessus, désapprouvez leur fonction plot_... correspondante. Nous n'avons pas besoin de déprécier plot_det_curve car il n'a pas encore été publié, nous pouvons simplement le supprimer.
pour les nouveaux PR comme #17443 et #18020, nous pouvons implémenter les méthodes de classe immédiatement au lieu d'introduire une fonction plot .

C'est un peu de travail mais je pense que nous pouvons le faire avant 0.24 afin que #17443 et #18020 puissent déjà avancer.

Une objection @thomasjpfan @jnothman @amueller @glemaitre ?

@jhennrich @pzelasko , seriez-vous intéressé à soumettre un PR pour introduire les méthodes de classe dans l'un des objets Display ?

NicolasHug le 3 oct. 2020

Merci d'avoir pris la décision @NicolasHug ! Je vais passer au #17443 (après avoir attendu les objections)

lucyleeow le 3 oct. 2020

Je n'ai aucune objection.

thomasjpfan le 5 oct. 2020

👍1

Aucune objection non plus.

glemaitre le 6 oct. 2020

Je m'occuperai alors des autres classes et avancerai mon RP bloqué.
@lucyleeow au cas où je n'aurais pas fait tout cela et que vous recherchez des

glemaitre le 6 oct. 2020

👍1

J'adorerais contribuer mais je suis engagé dans trop de projets en ce moment. Merci d'avoir écouté les suggestions!

pzelasko le 6 oct. 2020

Ça a l'air bien :)

amueller le 7 oct. 2020

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

Les documents CountVectorizer et TfidfVectorizer ne mentionnent pas que token_pattern est ignoré lors de la transmission d'un tokenizer personnalisé

stephantul · 3Commentaires

améliorations suggérées par min_weight_fraction_leaf

ben519 · 3Commentaires

Ajouter un badge Azure Pipelines au fichier Lisez-moi?

amueller · 3Commentaires

AttributeError : l'objet 'GridSearchCV' n'a pas d'attribut 'best_params_'

vitorcoliveira · 3Commentaires

Erreur d'importation lors du chargement d'un modèle décapé extrait de Pipeline

bmulas1535 · 3Commentaires