Pandas: DataFrame.describe não pode retornar percentis quando o conjunto de dados contém nan

Criado em 9 mai. 2016  ·  3Comentários  ·  Fonte: pandas-dev/pandas

Amostra de código, um exemplo que pode ser copiado e colado, se possível

des_table = df_final_S1415.describe (percentis = [. 05, .25, .5, .75, .95]). T

Saída Esperada

Na versão 18.0, a função de descrição retornará percentis quando as colunas contiverem nan.

saída de pd.show_versions()

Mas na versão 18.1, a função de descrição não retornará percentis quando as colunas contiverem nan.

Duplicate

Comentários muito úteis

Aqui está um exemplo reproduzível (o problema real está no método quantile ):

In [24]: s = pd.Series(range(5))

In [25]: s.quantile(0.5)
Out[25]: 2.0

In [26]: s[0] = np.nan

In [27]: s.quantile(0.5)
Out[27]: nan

In [28]: pd.__version__
Out[28]: '0.18.1+20.gaf7bdd3'

Todos 3 comentários

@ tade0726 Você pode mostrar um exemplo reproduzível? (algum código que constrói um dataframe que mostra o problema)

Aqui está um exemplo reproduzível (o problema real está no método quantile ):

In [24]: s = pd.Series(range(5))

In [25]: s.quantile(0.5)
Out[25]: 2.0

In [26]: s[0] = np.nan

In [27]: s.quantile(0.5)
Out[27]: nan

In [28]: pd.__version__
Out[28]: '0.18.1+20.gaf7bdd3'

E é uma duplicata de https://github.com/pydata/pandas/issues/13098

Obrigado por relatar

Esta página foi útil?
0 / 5 - 0 avaliações