Scikit-learn: [0.23.1] doctest GradientBoostingClassifier 在 arm(rhel) 处理器上失败

创建于 2020-07-01  ·  3评论  ·  资料来源: scikit-learn/scikit-learn

描述错误

在手臂处理器(AWS:gravition2,rhel)上,我在 0.23.1 版中遇到以下故障

1038     >>> from sklearn.model_selection import train_test_split
1039     >>> X, y = make_classification(random_state=0)
1040     >>> X_train, X_test, y_train, y_test = train_test_split(
1041     ...     X, y, random_state=0)
1042     >>> clf = GradientBoostingClassifier(random_state=0)
1043     >>> clf.fit(X_train, y_train)
1044     GradientBoostingClassifier(random_state=0)
1045     >>> clf.predict(X_test[:2])
1046     array([1, 0])
1047     >>> clf.score(X_test, y_test)
Expected:
    0.88
Got:
    0.84

重现的步骤/代码

pytest -v sklearn/ensemble/_gb.py::sklearn.ensemble._gb.GradientBoostingClassifier

预期成绩

PASSED 被抛出。

实际结果

FAILED 被抛出。

1047     >>> clf.score(X_test, y_test)
Expected:
    0.88
Got:
    0.84

版本

System:
    python: 3.6.8 (default, Dec  5 2019, 16:02:25)  [GCC 8.3.1 20191121 (Red Hat 8.3.1-5)]
executable: /usr/bin/python3
   machine: Linux-4.18.0-193.1.2.el8_2.aarch64-aarch64-with-redhat-8.2-Ootpa

Python dependencies:
          pip: 20.1.1
   setuptools: 39.2.0
      sklearn: 0.23.1
        numpy: 1.14.3
        scipy: 1.0.0
       Cython: 0.29
       pandas: 1.0.5
   matplotlib: 3.2.1
       joblib: 0.14.0
threadpoolctl: 2.1.0

Built with OpenMP: True
Linux-4.18.0-193.1.2.el8_2.aarch64-aarch64-with-redhat-8.2-Ootpa
Traceback (most recent call last):
  File "<string>", line 3, in <module>
NameError: name 'Python' is not defined
Bug arm help wanted ensemble

所有3条评论

感谢@murata-yu 的报告,我可以在https://github.com/scikit-learn/scikit-learn/pull/17996 中重现

尚不确定这是否表明存在实际问题,我们应该增加容忍度。

从用户的角度来看,0.8 范围内 4% 的精度变化看起来不仅仅是一个小的数值舍入差异。 值得研究。

我可以通过在docker / qemu 容器中的https://github.com/scikit-learn/scikit-learn/pull/17644#issuecomment -663857435 中所述。

此页面是否有帮助?
0 / 5 - 0 等级