Scikit-learn: [0.23.1] doctest GradientBoostingClassifier échoue sur les processeurs arm(rhel)

Créé le 1 juil. 2020 · 3Commentaires · Source: scikit-learn/scikit-learn

Décrivez le bogue

Sur les processeurs de bras (AWS:gravition2, rhel), j'obtiens l'échec suivant dans la version 0.23.1

1038     >>> from sklearn.model_selection import train_test_split
1039     >>> X, y = make_classification(random_state=0)
1040     >>> X_train, X_test, y_train, y_test = train_test_split(
1041     ...     X, y, random_state=0)
1042     >>> clf = GradientBoostingClassifier(random_state=0)
1043     >>> clf.fit(X_train, y_train)
1044     GradientBoostingClassifier(random_state=0)
1045     >>> clf.predict(X_test[:2])
1046     array([1, 0])
1047     >>> clf.score(X_test, y_test)
Expected:
    0.88
Got:
    0.84

Étapes/Code à reproduire

pytest -v sklearn/ensemble/_gb.py::sklearn.ensemble._gb.GradientBoostingClassifier

Résultats attendus

PASSED est lancé.

Résultats actuels

FAILED est lancé.

1047     >>> clf.score(X_test, y_test)
Expected:
    0.88
Got:
    0.84

Versions

System:
    python: 3.6.8 (default, Dec  5 2019, 16:02:25)  [GCC 8.3.1 20191121 (Red Hat 8.3.1-5)]
executable: /usr/bin/python3
   machine: Linux-4.18.0-193.1.2.el8_2.aarch64-aarch64-with-redhat-8.2-Ootpa

Python dependencies:
          pip: 20.1.1
   setuptools: 39.2.0
      sklearn: 0.23.1
        numpy: 1.14.3
        scipy: 1.0.0
       Cython: 0.29
       pandas: 1.0.5
   matplotlib: 3.2.1
       joblib: 0.14.0
threadpoolctl: 2.1.0

Built with OpenMP: True
Linux-4.18.0-193.1.2.el8_2.aarch64-aarch64-with-redhat-8.2-Ootpa
Traceback (most recent call last):
  File "<string>", line 3, in <module>
NameError: name 'Python' is not defined

Bug arm help wanted ensemble

Source

murata-yu

Tous les 3 commentaires

Merci pour le rapport @murata-yu , je peux reproduire dans https://github.com/scikit-learn/scikit-learn/pull/17996

Je ne sais pas encore si c'est une indication d'un problème réel, nous devrions simplement augmenter la tolérance.

rth le 26 juil. 2020

👍1

Du point de vue de l'utilisateur, 4% de changement de précision dans la plage de 0,8 ressemble à plus qu'un petit écart d'arrondi numérique. Cela vaut la peine d'enquêter.

ogrisel le 27 juil. 2020

Je peux reproduire le problème localement en créant scikit-learn dans un environnement arm64 miniforge dans le conteneur docker/qemu comme décrit dans https://github.com/scikit-learn/scikit-learn/pull/17644#issuecomment -663857435.

ogrisel le 28 juil. 2020

👍1

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

Erreur d'importation lors du chargement d'un modèle décapé extrait de Pipeline

bmulas1535 · 3Commentaires

Comportement inattendu de l'analyse de corrélation canonique (ACC)

shauli-ravfogel · 3Commentaires

L'algorithme EM dans GMM échoue pour les ensembles de données unidimensionnels utilisant 0.16.1 (mais très bien avec 0.15.2)

rebeccaroisin · 4Commentaires

Améliorer la conception des classes pour AgglomerativeClustering et FeatureAgglomeration (pooling_func dans AgglomerativeClustering ne fonctionnait pas)

yinruiqing · 3Commentaires

sklearn.metrics.classification_report est incorrect?

AntiDoctor · 3Commentaires