Numpy: '

作成日 2018年11月08日  ·  4コメント  ·  ソース: numpy/numpy

以下はバグであると確信していますが、そうでない場合は教えてください。 解決策をいただければ幸いです。

私はSCKlearnを介して標準のワンホットエンコーディングを実行しており、その過程で明らかにNumpyを使用しています。 printオプションをデフォルトのままにしておけば問題ありませんが、 numpy.set_printoptions(threshold='nan')関数を使用して(Numpyサマリーの代わりに)1つのホットエンコーディング配列全体を印刷すると、問題のタイトルにエラーが表示されます。 コードと対応するエラー/トレースバックレポートは次のとおりです。

import numpy
from numpy import array
from numpy import argmax
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder

data = "+++++++++QVQLVQSGGGVVQPGRSLRLSCAASGFTFSSHRMHWVRQAPGKGLEWVAAVSNDGSNEYYADSVKGRFTISRDKSTSTLYLQMDSLRPEDTAVYYCARERCVSSSCWARALDYWGQGSLVTVCS++++++++++"
seq_string = list(data)
print(seq_string)
values = array(seq_string)
print(values)
label_encoder = LabelEncoder()
integer_encoded = label_encoder.fit_transform(values)
print(integer_encoded)
onehot_encoder = OneHotEncoder(sparse=False)
integer_encoded = integer_encoded.reshape(len(integer_encoded), 1)
onehot_encoded = onehot_encoder.fit_transform(integer_encoded)
numpy.set_printoptions(threshold='nan')
print(onehot_encoded)
inverted = label_encoder.inverse_transform([argmax(onehot_encoded[1, :])])
print(inverted)
> ---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-1-43683b44d2e3> in <module>()
     24 onehot_encoded = onehot_encoder.fit_transform(integer_encoded)
     25 numpy.set_printoptions(threshold='nan')
---> 26 print(onehot_encoded)
     27 # invert first example
     28 inverted = label_encoder.inverse_transform([argmax(onehot_encoded[1, :])])

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in array_str(a, max_line_width, precision, suppress_small)
   1400         return str(a[()])
   1401 
-> 1402     return array2string(a, max_line_width, precision, suppress_small, ' ', "")
   1403 
   1404 def set_string_function(f, repr=True):

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in array2string(a, max_line_width, precision, suppress_small, separator, prefix, style, formatter, threshold, edgeitems, sign, floatmode, suffix, **kwarg)
    620         return "[]"
    621 
--> 622     return _array2string(a, options, separator, prefix)
    623 
    624 

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in wrapper(self, *args, **kwargs)
    420             repr_running.add(key)
    421             try:
--> 422                 return f(self, *args, **kwargs)
    423             finally:
    424                 repr_running.discard(key)

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in _array2string(a, options, separator, prefix)
    435     data = asarray(a)
    436 
--> 437     if a.size > options['threshold']:
    438         summary_insert = "..."
    439         data = _leading_trailing(data, options['edgeitems'])

TypeError: '>' not supported between instances of 'int' and 'str'

最も参考になるコメント

代わりにthreshold=sys.maxsize試してください。 thresholdintとして文書化されています。

全てのコメント4件

代わりにthreshold=sys.maxsize試してください。 thresholdintとして文書化されています。

おそらく、Python 3の準備のために、文字列「nan」を渡したときに1.16で例外をスローし始める必要がありますか?

残念ながら、stackoverflowは「nan」を渡すことをお勧めします。

SOの誤報へのリンク: https

代わりにthreshold=sys.maxsize試してください。 thresholdintとして文書化されています。

ありがとうございました! それは完全にうまくいきました。
実際、問題は前述のSOリンクをたどることによって発生しました。

このページは役に立ちましたか?
0 / 5 - 0 評価