Scikit-learn: فشل t-SNE مع المصفوفة يجب ألا يحتوي على infs أو NaNs (خاص بـ OSX)

تم إنشاؤها على ١٥ أبريل ٢٠١٦ · 108تعليقات · مصدر: scikit-learn/scikit-learn

Darwin-15.0.0-x86_64-i386-64bit
('Python', '2.7.11 |Anaconda custom (x86_64)| (default, Dec  6 2015, 18:57:58) \n[GCC 4.2.1 (Apple Inc. build 5577)]')
('NumPy', '1.11.0')
('SciPy', '0.17.0')
('Scikit-Learn', '0.17.1')

عند محاولة تشغيل t-SNE

proj = TSNE().fit_transform(X)
ValueError: array must not contain infs or NaNs

ومع ذلك

np.isfinite(X).all() # True 
np.isnan(X).all() # False
np.isinf(X).all() # False

تتبع المكدس الكامل:


ValueError                                Traceback (most recent call last)
<ipython-input-16-c25f35fd042c> in <module>()
----> 1 plot(X, y)

<ipython-input-1-72bdb7124d13> in plot(X, y)
     74 
     75 def plot(X, y):
---> 76     proj = TSNE().fit_transform(X)
     77     scatter(proj, y)

/Users/joelkuiper/anaconda/lib/python2.7/site-packages/sklearn/manifold/t_sne.pyc in fit_transform(self, X, y)
    864             Embedding of the training data in low-dimensional space.
    865         """
--> 866         embedding = self._fit(X)
    867         self.embedding_ = embedding
    868         return self.embedding_

/Users/joelkuiper/anaconda/lib/python2.7/site-packages/sklearn/manifold/t_sne.pyc in _fit(self, X, skip_num_points)
    775                           X_embedded=X_embedded,
    776                           neighbors=neighbors_nn,
--> 777                           skip_num_points=skip_num_points)
    778 
    779     def _tsne(self, P, degrees_of_freedom, n_samples, random_state,

/Users/joelkuiper/anaconda/lib/python2.7/site-packages/sklearn/manifold/t_sne.pyc in _tsne(self, P, degrees_of_freedom, n_samples, random_state, X_embedded, neighbors, skip_num_points)
    830         opt_args['momentum'] = 0.8
    831         opt_args['it'] = it + 1
--> 832         params, error, it = _gradient_descent(obj_func, params, **opt_args)
    833         if self.verbose:
    834             print("[t-SNE] Error after %d iterations with early "

/Users/joelkuiper/anaconda/lib/python2.7/site-packages/sklearn/manifold/t_sne.pyc in _gradient_descent(objective, p0, it, n_iter, objective_error, n_iter_check, n_iter_without_progress, momentum, learning_rate, min_gain, min_grad_norm, min_error_diff, verbose, args, kwargs)
    385     for i in range(it, n_iter):
    386         new_error, grad = objective(p, *args, **kwargs)
--> 387         grad_norm = linalg.norm(grad)
    388 
    389         inc = update * grad >= 0.0

/Users/joelkuiper/anaconda/lib/python2.7/site-packages/scipy/linalg/misc.pyc in norm(a, ord, axis, keepdims)
    127     """
    128     # Differs from numpy only in non-finite handling and the use of blas.
--> 129     a = np.asarray_chkfinite(a)
    130 
    131     # Only use optimized norms if axis and keepdims are not specified.

/Users/joelkuiper/anaconda/lib/python2.7/site-packages/numpy/lib/function_base.pyc in asarray_chkfinite(a, dtype, order)
   1020     if a.dtype.char in typecodes['AllFloat'] and not np.isfinite(a).all():
   1021         raise ValueError(
-> 1022             "array must not contain infs or NaNs")
   1023     return a
   1024 

ValueError: array must not contain infs or NaNs

Bug

مصدر

joelkuiper

التعليق الأكثر فائدة

بالنسبة لأي شخص يتأثر بهذا ، يجب أن يصلح ذلك:

conda remove numpy --force -y
pip uninstall numpy -y
conda install numpy

اسمحوا لي أن أعرف إذا كان هذا لا يعمل من أجلك.

lesteve في ١ ديسمبر ٢٠١٦

👍22 ❤7

ال 108 كومينتر

نفس الشيء مع ('Scikit-Learn'، '0.18.dev0')

joelkuiper في ١٥ أبريل ٢٠١٦

هل تمانع في مشاركة بياناتك X معي؟

KeyKy في ١٧ أبريل ٢٠١٦

👍1

بالتأكيد ، أين وبأي شكل تريده؟

في 17 أبريل 2016 ، الساعة 09:11 ، كتب 康洋[email protected] :
هل تمانع في مشاركة بياناتك X معي؟
-
أنت تتلقى هذا لأنك قمت بتأليف الموضوع.
قم بالرد على هذه الرسالة الإلكترونية مباشرة أو اعرضها على GitHub https://github.com/scikit-learn/scikit-learn/issues/6665#issuecomment -210968577

joelkuiper في ١٧ أبريل ٢٠١٦

بريدي الإلكتروني هو [email protected]
كما أعلم ، هناك دالة numpy.save لحفظ مصفوفة في ملف ثنائي بتنسيق .npy ~~

KeyKy في ١٧ أبريل ٢٠١٦

أختبر بياناتك في Ubuntu 14.04 LTS مع
بايثون == 2.7.6
scikit-learn == 0.17.1
numpy == 1.8.2
scipy == 0.13.3
إنه جيد ولا يرفع "خطأ القيمة". كود الاختبار هو:
`استيراد numpy
a = numpy.load ('/ root / test.npy')
طباعة شكل
طباعة numpy.isnan (أ). all () # False
طباعة numpy.isfinite (أ). all () # صحيح
طباعة numpy.isinf (a) .all () #False

من sklearn.manifold استيراد TSNE
proj = TSNE (). fit_transform (a) # [[2.35503527e + 00 1.15976751e + 01] .... [3.29832591e + 00 8.98212513e + 00]]
طباعة المشروع

ثم أقوم بترقية numpy و scipy إلى 1.11.0 و 0.17.0 واختبر بنفس الكود كما أنه لا يثير أي خطأ.

KeyKy في ١٨ أبريل ٢٠١٦

تم إعادة إنتاجه لـ 3.5 مع أناكوندا تحت OS X El Capitan.

Darwin 15.4.0
Python 3.5.1 :: Anaconda custom (x86_64)
numpy 1.10.4
scipy 0.17.0
scikit-learn 0.17.1

تشغيل مثال:

import random
from sklearn.manifold import TSNE
random.seed(1)
a = np.random.uniform(size=(100,20))
TSNE(n_components=2).fit_transform(a)

ivan-krukov في ١١ مايو ٢٠١٦

شكرًا @ ivan-krukov ، لكني فشلت في النسخ المتماثل في Python 3.3. سيحاول 3.5

jnothman في ١١ مايو ٢٠١٦

هذا لا ينطبق على linux (4.4.0-21 ، Ubuntu 16.04) مع نفس الحزم تحت 3.5.

ivan-krukov في ١١ مايو ٢٠١٦

أنا على El-Capitan ، لكنني أخفق في الحصول على تثبيت Python 3.5 وتشغيله.

jnothman في ١٢ مايو ٢٠١٦

هل هناك أي تحديث على ذلك؟

لدي مشكلة في مجموعة بيانات خاصة بي ، في Anaconda و Py 3.5 و sklearn 0.17.1 و OSX El Capitan.
يمكنني إعادة إنتاج الخطأ بالمثال المقدم من @ ivan-krukov.

dcbb في ١ يونيو ٢٠١٦

المشكلة نفسها. Python 2.7.6 في OS X El Capitan على 0.17. جربت نفس الكود على Linux باستخدام Python 2.7.6 و 0.17 ، وهو يعمل.

youyanggu في ٢ يونيو ٢٠١٦

المشكلة نفسها.
OSX El Capitan Python 3.5.1
scikit-learn == 0.17.1
scipy == 0.17.1

edevil في ٨ يونيو ٢٠١٦

لدي نفس المشكلة وأقدر حقًا إصلاحًا (أو حلًا بديلًا؟)
إصدار النظام: OS X 10.11.5
Python 3.5.1 :: Anaconda 4.0.0 (x86_64)
numpy.version.version 1.11.0
الإصدار 0.17.1 من scipy
sklearn. الإصدار 0.17.1

يمكنني أيضًا إعادة إنتاج الخطأ باستخدام عينة الرمز من ivan-krukov

Ekliptor في ١٣ يونيو ٢٠١٦

نفس المشكلة على OS X EI Capitan باستخدام Python 3.5

lucienevans في ١٦ يونيو ٢٠١٦

إصدار النظام: OS X 10.11.5
Python 3.5.1 :: Continuum Analytics، Inc.
حبيبي. الإصدار 1.11.1
scipy. الإصدار 0.16.0
sklearn. الإصدار 0.17.1

نفس المشكلة. على الرغم من أنني لاحظت أنه يحدث فقط لمجموعة فرعية من مجموعة البيانات الخاصة بي وليس مع كل شيء . بمعنى ، إذا قمت بإجراء TSNE على مجموعة البيانات بأكملها ، فإنها تعمل ، إذا قمت بذلك على مجموعة مخفضة فإنها لا تعمل.

Concomitant في ٢٩ يونيو ٢٠١٦

O_o ؛؛ هذا فقط ، إذا كررت نفس المجموعة الفرعية "المكسورة" التي لا تعمل (عن طريق القائمة * 10) فإنها تعمل. لا ينجح ضرب كل متجه فردي في 10 ، لكن تكرار التاريخ يعمل. مجرد مضاعفة طول القائمة غير كاف. ربما يكون هذا نوعًا من درجات التحقق من الحرية ،

Concomitant في ٢٩ يونيو ٢٠١٦

@ ivan-krukov لقد قمت بتثبيت الرصاصة اليوم وقمت بتثبيت El Capitan VM. لسوء الحظ لا يمكنني إعادة إنتاج مشكلتك.

Concomitant هل يمكنك إعادة إنشاء الخطأ في المثال المستقل الوارد في https://github.com/scikit-learn/scikit-learn/issues/6665#issuecomment -218365487؟

lesteve في ٣٠ يونيو ٢٠١٦

أنا على El-Capitan ، لكنني أخفق في الحصول على تثبيت Python 3.5 وتشغيله.

jnothman لا يبدو أنه يحدث فقط على Python 3.5 ، لذا إذا كان بإمكانك محاولة إعادة الإنتاج باستخدام Python 2.7 (مقتطف: https://github.com/scikit-learn/scikit-learn/issues/6665#issuecomment-218365487 ) هذا سيكون رائع.

lesteve في ٣٠ يونيو ٢٠١٦

@ lesteve يمكنني إعادة إنتاج المشكلة.

import numpy as np
import random
from sklearn.manifold import TSNE
random.seed(1)
a = np.random.uniform(size=(100,20))
TSNE(n_components=2).fit_transform(a)

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/dshank/miniconda3/envs/python3/lib/python3.5/site-packages/sklearn/manifold/t_sne.py", line 866, in fit_transform
    embedding = self._fit(X)
  File "/Users/dshank/miniconda3/envs/python3/lib/python3.5/site-packages/sklearn/manifold/t_sne.py", line 777, in _fit
    skip_num_points=skip_num_points)
  File "/Users/dshank/miniconda3/envs/python3/lib/python3.5/site-packages/sklearn/manifold/t_sne.py", line 832, in _tsne
    params, error, it = _gradient_descent(obj_func, params, **opt_args)
  File "/Users/dshank/miniconda3/envs/python3/lib/python3.5/site-packages/sklearn/manifold/t_sne.py", line 387, in _gradient_descent
    grad_norm = linalg.norm(grad)
  File "/Users/dshank/miniconda3/envs/python3/lib/python3.5/site-packages/scipy/linalg/misc.py", line 115, in norm
    a = np.asarray_chkfinite(a)
  File "/Users/dshank/miniconda3/envs/python3/lib/python3.5/site-packages/numpy/lib/function_base.py", line 1033, in asarray_chkfinite
    "array must not contain infs or NaNs")
ValueError: array must not contain infs or NaNs

مع اتباع نفس الكود:

>>> a = np.random.uniform(size=(10000,20))
>>> TSNE(n_components=2).fit_transform(a)
array([[  3.25766047e+11,  -2.74708004e+11],
       [  2.43498802e+11,  -7.68189047e+10],
       [ -6.00107639e+09,  -1.13548763e+11],
       ..., 
       [  3.02794039e+10,   6.64402020e+11],
       [  2.55855781e+10,   5.67932400e+10],
       [  1.42040378e+11,  -7.55188994e+10]])

غريب.

Concomitant في ٣٠ يونيو ٢٠١٦

لا يمكنني إعادة الإنتاج باستخدام python 3.5.1 و numpy 1.11.1 و scipy 0.17.1 و scikit-learn 0.17.1 من miniconda (مع MKL) على صندوق افتراضي مع OSX El Capitan. سأحاول على جهاز Mac حقيقي لاحقًا.

ogrisel في ٥ يوليو ٢٠١٦

وأيضًا joelkuiper و هل يمكنك التحقق من أنه يمكنك إعادة إنتاج المشكلة على الحالة الحالية لفرع scikit-Learn الرئيسي؟

ogrisel في ٥ يوليو ٢٠١٦

@ lesteve والآخرين لا يمكنني إعادة إنتاج الخطأ باستخدام المقتطف المنشور سابقًا على أحدث نسخة رئيسية مع python 2.7.

معلومات النظام:

Darwin-15.0.0-x86_64-i386-64bit
('Python', '2.7.10 (v2.7.10:15c95b7d81dc, May 23 2015, 09:33:12) \n[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)]')
('NumPy', '1.11.0')
('SciPy', '0.17.0')
('Scikit-Learn', '0.18.dev0')

nelson-liu في ٥ يوليو ٢٠١٦

لقد حاولت مرة أخرى على جهاز Mac حقيقي يعمل بنظام OSX El Capitan 10.11.3 (مع أحدث إصدارات أناكوندا scipy و scikit-Learn ، نفس الإعداد الذي أوردته Concomitant في https://github.com/scikit-learn/scikit-learn/issues / 6665 # issuecomment-229703129) ولكن لا يمكن إعادة إنتاج المشكلة أيضًا (حاول تشغيل المقتطف عدة مرات).

الغريب أنه بالرغم من السطر np.random.seed(1) فإنني أحصل على نتائج مختلفة لمخرجات fit_transform . قد يكون هذا خطأ في حد ذاته.

ogrisel في ٦ يوليو ٢٠١٦

ما هو غريب على الرغم من أنه على الرغم من سطر np.random.seed (1) أحصل على نتائج مختلفة لإخراج fit_transform. قد يكون هذا خطأ في حد ذاته.

في الواقع ، قرأت مقتطف الشفرة الخاص بـ Concomitant بسرعة كبيرة: بدلاً من random.seed(1) يجب أن يكون np.random.seed(1) وإلا لم تتم إعادة تعبئة RNG غير المتراكم بشكل مناسب ولا يمكن للمرء الحصول على نتائج حتمية.

ogrisel في ٦ يوليو ٢٠١٦

أدركت الآن أيضًا أنني قرأت المناقشة بأكملها بسرعة كبيرة وأن الخطأ يحدث فقط مع python 2.7. سأحاول مرة أخرى.

ogrisel في ٦ يوليو ٢٠١٦

لا يمكنني التكاثر مع python 2.7.12 من conda على OSX 10.11.3 أيضًا.

في الواقع ، يمكن لـ Ekliptor إعادة إنتاج المشكلة مع python 3.5.1 من conda ، لذلك ربما لا يتعلق الأمر بإصدار Python أيضًا. ربما يعتمد ذلك على الإصدار الثانوي من OSX. سيتم الترقية وإعادة المحاولة.

ogrisel في ٦ يوليو ٢٠١٦

لا يمكنني النسخ المتماثل مع OSX 10.11.5. لقد جربت كلاً من Python 2.7.12 و 3.5.2 المثبتين مع conda جنبًا إلى جنب مع numpy 1.11.1 و scipy 0.17.1 و scikit-learn 0.17.1.

أنا لا أعرف ما يجب القيام به. إذا كان أحدكم قادرًا على إعادة إنتاج المشكلة ، فالرجاء محاولة العثور على بذرة عشوائية عشوائية تؤدي إلى حدوث المشكلة (باستخدام np.random.seed(my_seed) بدلاً من random.seed(1) في المقتطف أعلاه) وتوصيل القيمة هنا (جنبًا إلى جنب مع إصدار OSX وأنت حزم python).

ogrisel في ٦ يوليو ٢٠١٦

يمكنني أن أؤكد أن المشكلة قد تم إصلاحها باستخدام أحدث إصدار. لا يمكنني إعادة إنتاجه كما كان من قبل.
لقد قمت بتحديث numpy فقط:
numpy.version.version 1.11.1

إلى جميع الأشخاص الذين يعملون مع Tensorflow يمكنني إضافة:
عندما أحاول رسم عينة صغيرة جدًا (<200 نقطة) ما زلت أواجه هذا الخطأ أحيانًا. بعد زيادة حجم العينة قمت بالمرور إلى tsne.fit_transform () فإنه يعمل دائمًا.

Ekliptor في ١١ يوليو ٢٠١٦

شكرًا Ekliptor للتحقق من أنه يعمل مع برنامج scikit-Learn Master. joelkuiper و Concomitant هل تؤكد أن برنامج scikit-Learn الرئيسي يعمل أيضًا من أجلك؟ إذا كان الأمر كذلك يمكننا إغلاق هذه المشكلة.

ogrisel في ١١ يوليو ٢٠١٦

لقد قمت بتثبيت سيد ، مقتطف الشفرة يعمل بشكل نظيف الآن.

Concomitant في ١١ يوليو ٢٠١٦

🎉1

يبدو أنه يعمل للجميع الآن. إغلاق.

amueller في ٢٨ يوليو ٢٠١٦

عذرًا ، لكني ما زلت أحصل على هذا على Python 3.5.1 و scikit 0.17 و scikit-learn 0.18 (الالتزام 9e913c04d748) و Numpy 1.11.1 على نظام التشغيل Mac OS 10.11.5.

dmyersturnbull في ١ أغسطس ٢٠١٦

👍6

dmyersturnbull هل تحصل على الخطأ عند تشغيل المقتطف من https://github.com/scikit-learn/scikit-learn/issues/6665#issuecomment -218365487؟

lesteve في ٢ أغسطس ٢٠١٦

@ lesteve فعلته مع ذلك المقتطف الدقيق ، نعم. ومع ذلك ، لم أعد أحصل عليه بعد مسح تثبيت Anaconda وإعادة تثبيته من البداية باستخدام Python 3.5.2.

dmyersturnbull في ٢ أغسطس ٢٠١٦

لدي نفس المشكلة مع Python 3.5.2 ، scikit-Learn 0.17.1 ، scipy 0.17.1 ، numpy 1.11.1 على Mac OS X El Capitan 10.11.3. إنه يعمل عندما يكون لدي أكثر من 2100 نقطة ولكنه يفشل في الحصول على قيم أقل.

jna29 في ٩ أغسطس ٢٠١٦

لدي نفس المشكلة مع Python 3.5.2 ، scikit-Learn 0.17.1 ، scipy 0.17.1 ، numpy 1.11.1 على Mac OS X El Capitan 10.11.3. إنه يعمل عندما يكون لدي أكثر من 2100 نقطة ولكنه يفشل في الحصول على قيم أقل.

فشل بشكل مماثل

أعد الفتح من فضلك

lucidyan في ٢٤ أغسطس ٢٠١٦

👍1

أواجه نفس المشكلة في OS X 10.11.6 و python 3.5.1 و sklearn 0.17.1 و numpy 1.11.1.
في مجموعة البيانات هذه: https://dl.dropboxusercontent.com/u/103591/vals.out (مع np.savetxt)

pbnsilva في ٣١ أغسطس ٢٠١٦

فشل بشكل مماثل لقيم النقاط المنخفضة

@ Lucidyan لا أفهم ما تعنيه بذلك.

أواجه نفس المشكلة في OS X 10.11.6 و python 3.5.1 و sklearn 0.17.1 و numpy 1.11.1.
في مجموعة البيانات هذه: https://dl.dropboxusercontent.com/u/103591/vals.out (مع np.savetxt)

pbnsilva هل يمكنك تجربة هذا المقتطف المنشور أدناه؟ قد تحتاج إلى تشغيله عدة مرات لأنه للأسف لم يتم تعيين البذور بشكل مناسب (تحتاج إلى استخدام np.random.seed بدلاً من random.seed ).

import random
from sklearn.manifold import TSNE
random.seed(1)
a = np.random.uniform(size=(100,20))
TSNE(n_components=2).fit_transform(a)

نقاط المكافأة إذا كان بإمكانك العثور على وسيطة أولية لـ np.random.seed ووسيطة random_state إلى TSNE تجعل المقتطف حتميًا.

بدلاً من ذلك ، أفاد بعض الأشخاص أنه تم إصلاح هذا الخطأ الرئيسي. هل يمكنك محاولة بناء برنامج ماجستير scikit-Learn لمعرفة ما إذا كانت المشكلة تختفي؟

lesteve في ٣١ أغسطس ٢٠١٦

lesteve قصدت أنني حصلت على نفس الخطأ مع عدد قليل من المثيلات ، مع نفس معلمات النظام (Python 3.5.2 ، scikit-Learn 0.17.1 ، scipy 0.17.1 ، numpy 1.11.1 على Mac OS X El Capitan 10.11.3)

pbnsilva هل يمكنك تجربة هذا المقتطف المنشور أدناه؟ قد تحتاج إلى تشغيله عدة مرات لأنه للأسف لم يتم تعيين البذور بشكل مناسب (تحتاج إلى استخدام np.random.seed بدلاً من random.seed).

لقد جربته وفشلت مع X_SIZE <= 1750 (Y_SIZE = 20 ، n_components = 2 أصبحت ثوابت). إذا بدأت في تغيير الثوابت (الزيادة) مع X_SIZE الثابت = 1750 ، فإنه يفشل أيضًا.

lucidyan في ٢ سبتمبر ٢٠١٦

Lucidyan هل يمكنك تجربة نفس المقتطف مع scikit-Learn master ومعرفة ما إذا كان قد فشل أيضًا؟

lesteve في ٦ سبتمبر ٢٠١٦

نعم لا تعمل لدي (numpy 1.11.1 ، El capitan.10.11 ، sklearn 0.17.1 ، python 3.5.2) بشكل مزعج أنه كسر الكود القديم الذي كان يعمل. ماذا تغيرتم يا رفاق ...؟

act65 في ٢٠ سبتمبر ٢٠١٦

@ act65 ، نحن حريصون جدًا على الوصول إلى الجزء السفلي من هذا ولكننا لم نتمكن من إعادة الإنتاج ويبدو أننا نتلقى تقارير مختلطة من المستخدمين حتى الآن للأسف.

لذا ، إذا لم تكن قد فعلت ذلك بالفعل (للأسف ، نحن لا نمانع القراء ولا تخبرنا عبارة "لا نعمل لدي" بما جربته) ، هل يمكنك محاولة تشغيل المقتطف المذكور أعلاه في https://github.com/scikit-learn / scikit-learn / issues / 6665 # issuecomment -243782185. حاول تشغيله عدة مرات فقط في حالة عدم تعيين البذور العشوائية بشكل صحيح وقد يكون هناك بعض العشوائية المتبقية في المقتطف.

ثم ما الذي سيكون رائعًا حقًا إذا كان بإمكانك تجربة الإصدار 0.18 المرشح الذي يكون سهل التثبيت (موصى به بشدة للقيام بذلك في Virtualenv أو conda env منفصل):

pip install --pre scikit-learn -U

تم تحريره: تم إصدار 0.18 لذا يمكنك فقط استخدام (لا حاجة لاستخدام --pre ):

pip install scikit-learn -U

وأعد تشغيل المقتطف لمعرفة ما إذا كان قد تم إصلاحه في 0.18 كما أبلغ بعض المستخدمين في هذا الموضوع بالفعل.

سيتم إصدار 0.18 في غضون أسابيع قليلة إن لم يكن أيام حتى تعرف ما عليك القيام به إذا كنت تريد مساعدتنا في الوصول إلى الجزء السفلي من هذا قبل الإصدار ؛-).

lesteve في ٢٠ سبتمبر ٢٠١٦

❤2 👍2

نعم سيئي ، كان يجب أن يكون أوضح. (لقد جربت نفس الشيء تقريبًا الذي جربه الآخرون ، فقط على MNIST).

على أي حال ، إنه يعمل! شكر :)
pip install --pre scikit-learn -U أصلحه

act65 في ٢٠ سبتمبر ٢٠١٦

حسنًا ، شكرًا لك على الإبلاغ ، ومن الرائع أن نسمع أن هذا تم إصلاحه لك في الإصدار 0.18 المرشح! يبدو أن هذا يتطابق مع ما أبلغ عنه الآخرون عندما يقولون إنه تم إصلاحه في الإصدار الرئيسي.

فقط من أجل الاكتمال ، يوصى بالالتزام بالإصدارات التي تم إصدارها لرمز الإنتاج ، لذلك قد تحتاج إلى الانتظار قليلاً حتى يتم إصدار 0.18.

lesteve في ٢٠ سبتمبر ٢٠١٦

تضمين التغريدة
جربت المقتطف على الإصدار 0.18rc2 ، المثبت بواسطة

تثبيت نقطة - قبل scikit-learn -U

ويبدو أنه يعمل! في صحتك!

lucidyan في ٢٠ سبتمبر ٢٠١٦

شكرا @ Lucidyan لتجربتها.

lesteve في ٢١ سبتمبر ٢٠١٦

عذرًا ، ما زلت أتلقى هذا الخطأ مع مقتطف الشفرة أعلاه بعد الترقية إلى scikit-learn 0.18 ( pip install --pre scikit-learn -U ) في conda env.

هنا معلومات نظامي:
OS X El Capitan الإصدار 10.11.4
بايثون 2.7.12
sklearn 0.18 (حصلت على نفس الخطأ في sklearn 0.17.1 كذلك)
numpy 1.11.1 (حصلت على نفس الخطأ في numpy 1.11.2 أيضًا)
scipy 0.18.1.0 تحديث

ومع ذلك ، قمت بتشغيل نفس مقتطف الشفرة على نظام Linux ، ولم أحصل على خطأ.
معلومات نظام نظام Linux هي:
نظام التشغيل Ubuntu 14.04.5 LTS (GNU / Linux 3.13.0-91-generic x86_64)
بايثون 2.7.6
sklearn 0.18.0 تحديث
numpy 1.11.2
scipy 0.13.3.0 تحديث

zhongyuk في ٣١ أكتوبر ٢٠١٦

حاول إلغاء تثبيت وإعادة تثبيت numpy و scipy و scikit-learn. إذا استمر فشل ذلك ، فحاول استخدام بيئة افتراضية مختلفة (أو بيئة conda إذا كنت تستخدم conda) للتأكد من وجود خطأ ما في بيئة Python الخاصة بك.

lesteve في ٢ نوفمبر ٢٠١٦

لا يزال يظهر نفس الخطأ ( ValueError: array must not contain infs or NaNs ) في sklearn 0.18 ( 0.18-np111py35_0 ) عبر conda. يبدو أن عجلات الأنابيب تعمل بشكل جيد!

rasbt في ٣ نوفمبر ٢٠١٦

لا يزال هناك نفس الخطأ (ValueError: المصفوفة يجب ألا تحتوي على infs أو NaNs) في sklearn 0.18 (0.18-np111py35_0) عبر conda. يبدو أن عجلات الأنابيب تعمل بشكل جيد!

هممم مثير للاهتمام ... هل يمكنك تجربة استخدام حزم conda بدون mkl ، أي شيء مثل conda create -n sklearn_nomkl python scikit-learn nomkl حتى نتمكن من معرفة ما إذا كان هذا هو أمر MKL مقابل openblas؟

أيضًا نقاط المكافأة إذا كان بإمكانك تقديم مقتطف يعيد إنتاج المشكلة باستخدام أصل عشوائي ثابت (أي باستخدام np.random.RandomState(some_int) ) يمكن استخدامه كمقتطف مرجعي من الآن فصاعدًا. حتى الآن ، المقتطف الذي لدينا غير محدد (يتم استخدام random.seed وليس له تأثير numpy.random seed).

lesteve في ٣ نوفمبر ٢٠١٦

بالتأكيد لا مشكلة. قد تكون هذه مشكلة BLAS بالفعل ، فإن env conda create -n sklearn_nomkl python scikit-learn nomkl يعمل بشكل جيد.

بخصوص المقتطف ... هذا مثير للاهتمام. على سبيل المثال ،

from sklearn.manifold import TSNE
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_digits

digits = load_digits()

X_train, X_test, y_train, y_test = train_test_split(digits.data, 
                                                    digits.target, 
                                                    random_state=1)

tsne = TSNE(random_state=1)
digits_tsne_train = tsne.fit_transform(X_train)

إعادة إنتاج المشكلة على جهازي. ومع ذلك ، عندما أستبدل digits_tsne_train = tsne.fit_transform(X_train) بـ digits_tsne_train = tsne.fit_transform(digits.data) يبدو الأمر على ما يرام. سيكون من الجيد العثور على مثال خفيف الوزن ربما لإضافة هذه الحالة بالذات إلى اختبارات ترافيس.

تحرير: نفس الشيء ينطبق على القزحية. iris.data في fit_transform ، بينما لا تعمل مجموعة البيانات المقسمة ( X_train ). ربما هناك شيء مضحك يحدث في train_test_split . ومع ذلك ، يبدو أن كلا من X_train و iris.data عائم 64 مصفوفة ...

rasbt في ٣ نوفمبر ٢٠١٦

ماذا عن المقتطف من https://github.com/scikit-learn/scikit-learn/issues/6665#issuecomment -243782185 ، لم تجد طريقة لجعله حتميًا وما زلت تفشل على جهازك؟

lesteve في ٣ نوفمبر ٢٠١٦

المقتطف

import numpy as np
from sklearn.manifold import TSNE

np.random.seed(1)

a = np.random.uniform(size=(100, 20))
TSNE(n_components=2, random_state=1).fit_transform(a)

يعيد إنتاج الخطأ (لكنه يعمل بشكل جيد على Nomkl env)

rasbt في ٣ نوفمبر ٢٠١٦

حسنًا ، شكرًا جزيلاً على هذا ، على الأقل لدينا مقتطف محدد الآن. للتسجيل ، يمكنك نشر ناتج هذا المقتطف:

import platform; print(platform.platform())
import sys; print("Python", sys.version)
import numpy; print("NumPy", numpy.__version__)
import scipy; print("SciPy", scipy.__version__)
import sklearn; print("Scikit-Learn", sklearn.__version__)

أيضًا ، فقط من أجل السلامة العقلية ، هل يمكنك التأكد من أنه يمكنك إعادة إنتاج المشكلة في بيئة كوندا جديدة.

لأكون صادقًا ، لست متأكدًا من أين نذهب من هذا. لم أحاول منذ ذلك الحين ولكني لم أتمكن من إعادة الإنتاج على صندوق El Capital الظاهري ، لم يتمكن ogrisel من التكاثر أيضًا على كمبيوتر محمول OSX ، لذلك في الوقت الذي قال فيه أنه قد تكون هناك بعض المشاكل الخاصة بالأجهزة.

lesteve في ٣ نوفمبر ٢٠١٦

بالتأكيد ،

الجهاز الذي يسبب هذه المشكلة:

Darwin-16.1.0-x86_64-i386-64bit
Python 3.5.2 |Continuum Analytics, Inc.| (default, Jul  2 2016, 17:52:12) 
[GCC 4.2.1 Compatible Apple LLVM 4.2 (clang-425.0.28)]
NumPy 1.11.2
SciPy 0.18.1
Scikit-Learn 0.18

(جربته في بيئة كوندا جديدة)

قد يكون هناك بعض المشاكل المتعلقة بالأجهزة.

أعتقد أنك قد تكون على شيء! لقد جربته على جهاز Mac الآخر ، وهو يعمل بشكل جيد هناك. الاختلاف الوحيد هو أن المخرجات أعلاه تعمل على نواة أقدم ( Darwin-15.6.0-x86_64-i386-64bit ). لم تقم بتحديث نظام mac الثاني إلى macOS Sierra حتى الآن ، والذي يعمل على الجهاز السابق الذي يعاني من هذه المشكلة. يمكن أن يكون مرتبطًا بنظام التشغيل. سأقوم بترقية الجهاز الثاني إلى Sierra في الشهر المقبل أو نحو ذلك (أنا في منتصف مشروع ولا أريد كسر الأشياء) ، لكن يمكنني إخبارك إذا كان التحديث إلى Sierra يؤدي إلى هذه المشكلة على الجهاز الثاني (أو ربما يمكن لشخص آخر لديه نظام macOS Sierra اختباره حتى نتمكن الآن من اختباره إذا كان نظام تشغيل)

rasbt في ٣ نوفمبر ٢٠١٦

نظرًا لأنه تم الإبلاغ عن المشكلة في إصدارات OSX المختلفة ، فأنا أشك في أن هذه ليست سوى مشكلة إصدار OSX. كان حدس IIRCogrisel هو أنه يتعلق ببنية وحدة المعالجة المركزية.

هناك طريقة أخرى (تستغرق وقتًا أطول) لتصحيح هذه المشكلة وهي تتبع مكان ظهور NaNs في الكود.

lesteve في ٤ نوفمبر ٢٠١٦

كان حدس IIRCogrisel هو أنه يتعلق ببنية وحدة المعالجة المركزية.

حسنًا ، كيف ستختلف نسخة conda scikit-Learn عن عجلات البيب؟ لأن الأخير يبدو أنه يعمل على نفس الجهاز. ربما يتعلق الأمر بطريقة ما بـ conda

rasbt في ٤ نوفمبر ٢٠١٦

هناك طريقة أخرى (تستغرق وقتًا أطول) لتصحيح هذه المشكلة وهي تتبع مكان ظهور NaNs في الكود.

لقد لاحظت أن التدرج اللوني في https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/manifold/t_sne.py#L387 ينفجر ، حتى يصبح -inf في موضع واحد بعد التكرار الخامس والعشرون في https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/manifold/t_sne.py#L386 for-loop

...
   0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00
   0.00000000e+00   0.00000000e+00   6.06587795e+32  -1.10699515e+33
  -1.55245133e+34              inf  -1.52569936e+33  -3.43926080e+33
  -1.92332051e+32  -2.73996151e+32  -2.57570880e+33  -3.64962271e+33
...

على الجهاز الآخر (الجهاز الذي يعمل بشكل جيد) ، تكون جميع التدرجات <0 بعد نفس التكرار. لذلك ، بطريقة ما لا تعمل وظيفة _gradient_descent بشكل صحيح (ربما بسبب بعض عناصر BLAS).

rasbt في ٤ نوفمبر ٢٠١٦

حسنًا ، كيف ستختلف نسخة conda scikit-Learn عن عجلات البيب؟ لأن الأخير يبدو أنه يعمل على نفس الجهاز. ربما يتعلق الأمر بطريقة ما بـ conda

تستخدم عجلات النقطة OpenBLAS ولا تواجهك مشكلة عند استخدام OpenBLAS مع conda (من خلال خدعة nomkl ) لذلك يبدو هذا وكأنه مشكلة MKL ، والتي من المحتمل أن تكون خاصة بوحدة المعالجة المركزية.

lesteve في ٤ نوفمبر ٢٠١٦

بالمناسبة ، عمل رائع لتصحيح المشكلة! نقاط المكافأة إذا تمكنت من عزل المشكلة بشكل أكبر (على سبيل المثال عن طريق انتقاء البيانات قبل ظهور التكرار inf ). تظهر المشكلة على الأرجح في بعض رموز cython في sklearn / manifold / _barnes_hut_tsne.pyx.

lesteve في ٤ نوفمبر ٢٠١٦

ألا ينبغي إعادة فتح هذه القضية في ضوء آخر النتائج؟ لقد ضربتها أيضًا وتمكنت أيضًا من تجاوزها باستخدام خدعة nomkl ، لكنني أشعر وكأنها حشرة نشطة مقابل واحدة مغلقة ، أليس كذلك؟

الآخرين الذين تم ضرب هذا: https://discussions.udacity.com/t/assignment-5-error-in-the-main-code-valueerror-array-must-not-contain-infs-or-nans/178187 / 7

luisatlive في ٢١ نوفمبر ٢٠١٦

أنت على حق ، إعادة الافتتاح. هذا واحد خطير ، ويبدو أنه خاص بالأجهزة ولا يمكن لأي من المطورين الأساسيين إعادة إنتاجه. الطريقة الوحيدة لإصلاح ذلك هي إذا استثمر الأشخاص الذين يواجهون المشكلة بعض الوقت في تصحيح المشكلة بشكل أكبر.

lesteve في ٢٢ نوفمبر ٢٠١٦

بالمناسبة ، عمل رائع لتصحيح المشكلة! نقاط المكافأة إذا تمكنت من عزل المشكلة بشكل أكبر (على سبيل المثال عن طريق انتقاء البيانات قبل ظهور ملف inf التكرار). تظهر المشكلة على الأرجح في بعض رموز cython في sklearn / manifold / _barnes_hut_tsne.pyx.

يسعدني النظر في الأمر بمزيد من التفصيل في ديسمبر بعد كل المواعيد النهائية لشهر نوفمبر ... ومع ذلك ، حتى هذا يمكن عزله بشكل أكبر ، فأنا أشعر بالفضول لمعرفة ما إذا كان هناك حل لهذه المشكلة الخاصة بالأجهزة. ربما ، حتى يتم حل هذا الأمر بالكامل ، قد يكون من المفيد رفع استثناء / تحذير أكثر تحديدًا إذا كان التدرج يحتوي على infs مع ملاحظة حول هذه المشكلة؟

rasbt في ٢٢ نوفمبر ٢٠١٦

لقد أنشأت للتو conda virtualenv جديدًا وأنشأت نسخة مطورة من sklearn من الكود المصدري المتشعب حديثًا من الفرع الرئيسي sciki-Learn ، اختفى الخطأ. هل تم إنشاء devp sklearn من شفرة المصدر باستخدام OpenBLAS بدلاً من MKL؟

zhongyuk في ٢٢ نوفمبر ٢٠١٦

يسعدني النظر في الأمر بمزيد من التفصيل في ديسمبر بعد كل المواعيد النهائية لشهر نوفمبر ...

يبدو رائعا ، شكرا جزيلا!

ومع ذلك ، حتى هذا يمكن عزله بشكل أكبر ، فأنا أشعر بالفضول إذا كان هناك حل لمشكلة خاصة بالأجهزة.

لست متأكدًا من الإصلاح ، نأمل أن نتمكن من تغيير كود cython الخاص بنا لحل المشكلة بمجرد عزلها. كما يمكن أن تكون مشكلة openblas وسيكون ذلك أمرًا رائعًا للإبلاغ عنه ، خاصة وأن العجلات تستخدم openblas.

ربما ، حتى يتم حل هذا الأمر بالكامل ، قد يكون من المفيد رفع استثناء / تحذير أكثر تحديدًا إذا كان التدرج يحتوي على infs مع ملاحظة حول هذه المشكلة؟

تبدو إضافة بعض النصائح إلى رسالة الخطأ (فقط على OS X) فكرة جيدة ، لكنني لست متأكدًا مما يجب أن تقوله ، ربما "فكر في استخدام conda وتثبيت scikit-learn مع MKL" أو شيء من هذا القبيل.

lesteve في ٢٣ نوفمبر ٢٠١٦

هل تم إنشاء devp sklearn من شفرة المصدر باستخدام OpenBLAS بدلاً من MKL؟

zhongyuk يعتمد على المكتبة التي قمت بتثبيتها. تتمثل إحدى طرق المعرفة بمجرد إنشاء scikit-Learn من المصدر في تشغيل ما يعادل ldd (يبدو أن Google تقول otool -L ) على sklearn/cluster/_k_means.so (سيكون الاسم مختلفًا إذا أنت تستخدم Python 3 ، أي شيء مثل sklearn/cluster/_k_means.cpython-35m-x86_64-linux-gnu.so ). على جهاز Ubuntu الخاص بي على سبيل المثال ، أحصل على هذا:

sklearn/cluster/_k_means.so:
        linux-vdso.so.1 =>  (0x00007ffc2312a000)
        libmkl_intel_lp64.so => /home/lesteve/miniconda3/envs/py27/lib/libmkl_intel_lp64.so (0x00007fadc2865000)
        libmkl_intel_thread.so => /home/lesteve/miniconda3/envs/py27/lib/libmkl_intel_thread.so (0x00007fadc0ee4000)
        libmkl_core.so => /home/lesteve/miniconda3/envs/py27/lib/libmkl_core.so (0x00007fadbf483000)
        libiomp5.so => /home/lesteve/miniconda3/envs/py27/lib/libiomp5.so (0x00007fadbf139000)
        libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007fadbeeeb000)
        libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007fadbebe1000)
        libpython2.7.so.1.0 => /home/lesteve/miniconda3/envs/py27/lib/libpython2.7.so.1.0 (0x00007fadbe7fa000)
        libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fadbe431000)
        libdl.so.2 => /lib/x86_64-linux-gnu/libdl.so.2 (0x00007fadbe22c000)
        libgcc_s.so.1 => /lib/x86_64-linux-gnu/libgcc_s.so.1 (0x00007fadbe016000)
        /lib64/ld-linux-x86-64.so.2 (0x0000563bdeda1000)
        libutil.so.1 => /lib/x86_64-linux-gnu/libutil.so.1 (0x00007fadbde12000)

لذلك يمكنك أن ترى من السطر الثالث ، أنه يستخدم MKL.

lesteve في ٢٣ نوفمبر ٢٠١٦

لكني لست متأكدًا مما يجب أن يقوله ، ربما "فكر في استخدام conda وتثبيت scikit-learn مع MKL" أو شيء من هذا القبيل.

أردت فقط أن أكتب أنني أعتقد أنك قد انقلبت: لقد نجحت العجلات في العثور وحدثت المشكلة فقط عندما كنت أستخدمها عبر conda مع MKL ... الآن ، أعتقد أن لدي أخبارًا جيدة بطريقة ما: أردت فقط أعد تشغيل المثال أعلاه الذي تسبب سابقًا في تأكيد هذه المشكلة

import numpy as np
from sklearn.manifold import TSNE

np.random.seed(1)

a = np.random.uniform(size=(100, 20))
TSNE(n_components=2, random_state=1).fit_transform(a)

ولم أعد أتلقى هذه المشكلة. أتذكر أنني أعدت تثبيت miniconda الأسبوع الماضي بسبب بعض المشاكل الأخرى. هل تعتقد أنه يمكن أن يكون مرتبطًا ببعض القضايا في الكوندا القديم؟ سيكون رائعًا إذا كان بإمكان بعض الأشخاص الآخرين الذين لديهم هذه المشكلة محاولة تحديث / إعادة تثبيت conda والتحقق مما إذا كان ذلك يحل المشكلة بالنسبة لهم. وفي الوقت نفسه ، سأحاول معرفة ما إذا كان بإمكاني العثور على حالة احتياطية قديمة لمعرفة إصدار conda الذي قمت بتثبيته مسبقًا. (الآن ، لدي conda 4.2.12)

rasbt في ٢٣ نوفمبر ٢٠١٦

أريد فقط أن أقول إنني قمت بتشغيل otool -L على sklearn/manifold/_barnes_hut_tsne.so (أفترض أن هذا هو الملف المترجم t_sne.py؟) ، يبدو أنه بالفعل يستخدم BLAS. والشخص الذي ألقى بالخطأ يبدو أنه يستخدم MKL ..

إصدار conda الذي أملكه هو 4.2.13 ، كل من env الذي يرمي الخطأ و env مع sklearn مبني بالمصدر (الذي لا يرمي خطأ) موجودان داخل conda.

zhongyuk في ٢٣ نوفمبر ٢٠١٦

حسنًا ، مثير للاهتمام ، لذا فهي ليست مشكلة كوندا بعد كل ذلك ... من الغريب لماذا تعمل بالنسبة لي الآن: /
(كل ما يمكنني أن أعتقد أنه قد تغير (باستثناء إعادة تثبيت conda) هو إعادة التشغيل: P)

rasbt في ٢٣ نوفمبر ٢٠١٦

😄1

أردت فقط أن أكتب أنني أعتقد أنك قد انقلبت: لقد نجحت العجلات في العثور على المشكلة وحدثت فقط عندما كنت أستخدمها عبر conda مع MKL

نعم ، آسف لذلك. سأقوم بتحرير عنوان المشكلة لمحاولة تذكره بشكل صحيح في المرة القادمة.

حسنًا ، مثير للاهتمام ، لذا فهي ليست مشكلة كوندا بعد كل ذلك ... من الغريب لماذا تعمل بالنسبة لي الآن: /
(كل ما يمكنني أن أعتقد أنه قد تغير (باستثناء إعادة تثبيت conda) هو إعادة التشغيل: P)

حسنًا ، تخمين عشوائي ربما نسخة mkl ، على الرغم من أنني إذا كنت أعتقد أن إخراج conda info mkl فإن أحدث إصدار mkl (11.3.3) هو من 2016-05-13.

lesteve في ٢٣ نوفمبر ٢٠١٦

zhongyuk حاول بناء scikit-Learn داخل بيئة conda تستخدم mkl ، أعتقد أن هذا يجب أن يكون كافيًا لالتقاط mkl (ربما تكون فكرة جيدة في هذه الحالة أن تفعل make clean ثم make in لإعادة البناء من الصفر).

lesteve في ٢٣ نوفمبر ٢٠١٦

@ lesteve لقد قمت ببناء scikit-Learn في بيئتين ظاهريتين conda من الكود المصدري (إصدار الفرع 0.18) ، أحدهما يستخدم MKL يرمي الخطأ بالفعل ؛ واحد يستخدم libBLAS لا يرمي الخطأ.

الناتج الذي يعمل otool -L على sklearn/manifold/_barnes_hut_tsne.so هنا (في حال كان إصدار MKL يعطيك أي دليل؟)

"" @ rpath/libmkl_intel_lp64.dylib (إصدار التوافق 0.0.0 ، الإصدار الحالي 0.0.0)
@ rpath / libmkl_intel_thread.dylib (إصدار التوافق 0.0.0 ، الإصدار الحالي 0.0.0)
@ rpath / libmkl_core.dylib (إصدار التوافق 0.0.0 ، الإصدار الحالي 0.0.0)
@ rpath / libiomp5.dylib (إصدار التوافق 5.0.0 ، الإصدار الحالي 5.0.0)
/usr/lib/libSystem.B.dylib (إصدار التوافق 1.0.0 ، الإصدار الحالي 1226.10.1)

zhongyuk في ٢٤ نوفمبر ٢٠١٦

zhongyuk عظيم! للتأكد من اكتمالها ، هل يمكنك نشر ناتج conda list '(mkl|cython|numpy|scipy)$' (في بيئة MKL conda الخاصة بك)؟ أثناء وجودنا فيه ، ستكون معلومات وحدة المعالجة المركزية ( sysctl -n machdep.cpu.brand_string وفقًا لـ Google) ومعلومات النظام الأساسي ( python -c 'import platform; print(platform.platform())' ) رائعة.

ما سيكون رائعًا حقًا هو الاستمرار في المكان الذي توقف فيه rabst وعزل المشكلة بشكل أكبر:
https://github.com/scikit-learn/scikit-learn/issues/6665#issuecomment -258311980

نظرًا لأن هذا مرتبط بـ BLAS ، فإن حدسي هو أن هناك خطأ ما في هذا الخط مما يتسبب في أن يكون للتدرج بعض القيم غير المحدودة.

lesteve في ٢٤ نوفمبر ٢٠١٦

lesteve إخراج معلومات بيئة

Cython                    0.25.1                    <pip>
mkl                       11.3.3                        0  
numpy                     1.11.1                    <pip>
numpy                     1.11.1                   py27_0 
scipy                     0.18.1              np111py27_0

معلومات وحدة المعالجة المركزية: Intel(R) Core(TM) i5-5257U CPU @ 2.70GHz
معلومات النظام الأساسي: Darwin-15.4.0-x86_64-i386-64bit

سأبحث في مشكلة انفجار التدرج التي والسطر الذي دائم بأي نتائج مثيرة للاهتمام.

zhongyuk في ٢٤ نوفمبر ٢٠١٦

zhongyuk إذا كان ذلك

rasbt في ٢٥ نوفمبر ٢٠١٦

rasbt hmm ، أتساءل عما إذا كانت المشكلة قد