Numpy: '

Criado em 8 nov. 2018  ·  4Comentários  ·  Fonte: numpy/numpy

Tenho certeza de que o seguinte é um bug, mas, por favor, me esclareça se não for. Uma solução seria muito apreciada.

Estou fazendo uma codificação padrão por meio do SCKlearn e, obviamente, usando o Numpy no processo. Está tudo bem quando eu deixo a opção de impressão como padrão, mas quando eu uso a função numpy.set_printoptions(threshold='nan') para imprimir todo o array de codificação ativo (em vez do resumo do Numpy), recebo o erro no título do problema. Aqui está o código e o relatório de erro / Traceback correspondente:

import numpy
from numpy import array
from numpy import argmax
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder

data = "+++++++++QVQLVQSGGGVVQPGRSLRLSCAASGFTFSSHRMHWVRQAPGKGLEWVAAVSNDGSNEYYADSVKGRFTISRDKSTSTLYLQMDSLRPEDTAVYYCARERCVSSSCWARALDYWGQGSLVTVCS++++++++++"
seq_string = list(data)
print(seq_string)
values = array(seq_string)
print(values)
label_encoder = LabelEncoder()
integer_encoded = label_encoder.fit_transform(values)
print(integer_encoded)
onehot_encoder = OneHotEncoder(sparse=False)
integer_encoded = integer_encoded.reshape(len(integer_encoded), 1)
onehot_encoded = onehot_encoder.fit_transform(integer_encoded)
numpy.set_printoptions(threshold='nan')
print(onehot_encoded)
inverted = label_encoder.inverse_transform([argmax(onehot_encoded[1, :])])
print(inverted)
> ---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-1-43683b44d2e3> in <module>()
     24 onehot_encoded = onehot_encoder.fit_transform(integer_encoded)
     25 numpy.set_printoptions(threshold='nan')
---> 26 print(onehot_encoded)
     27 # invert first example
     28 inverted = label_encoder.inverse_transform([argmax(onehot_encoded[1, :])])

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in array_str(a, max_line_width, precision, suppress_small)
   1400         return str(a[()])
   1401 
-> 1402     return array2string(a, max_line_width, precision, suppress_small, ' ', "")
   1403 
   1404 def set_string_function(f, repr=True):

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in array2string(a, max_line_width, precision, suppress_small, separator, prefix, style, formatter, threshold, edgeitems, sign, floatmode, suffix, **kwarg)
    620         return "[]"
    621 
--> 622     return _array2string(a, options, separator, prefix)
    623 
    624 

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in wrapper(self, *args, **kwargs)
    420             repr_running.add(key)
    421             try:
--> 422                 return f(self, *args, **kwargs)
    423             finally:
    424                 repr_running.discard(key)

/d/harpy1/s/python/v3-5.1.0/lib/python3.6/site-packages/numpy/core/arrayprint.py in _array2string(a, options, separator, prefix)
    435     data = asarray(a)
    436 
--> 437     if a.size > options['threshold']:
    438         summary_insert = "..."
    439         data = _leading_trailing(data, options['edgeitems'])

TypeError: '>' not supported between instances of 'int' and 'str'

Comentários muito úteis

Em vez disso, tente threshold=sys.maxsize , threshold está documentado como int .

Todos 4 comentários

Em vez disso, tente threshold=sys.maxsize , threshold está documentado como int .

Talvez devêssemos começar a lançar uma exceção no 1.16 quando as pessoas passarem a string "nan", para prepará-las para o python 3?

Infelizmente stackoverflow recomenda passar 'nan'.

Em vez disso, tente threshold=sys.maxsize , threshold está documentado como int .

Obrigado! funcionou perfeitamente bem.
Na verdade, o problema surgiu ao seguir o link do SO mencionado.

Esta página foi útil?
0 / 5 - 0 avaliações