Pandas: DataFrame.describe no puede devolver percentiles cuando el conjunto de datos contiene nan

Creado en 9 may. 2016  ·  3Comentarios  ·  Fuente: pandas-dev/pandas

Ejemplo de código, un ejemplo que se puede copiar, si es posible

des_table = df_final_S1415.describe (percentiles = [. 05, .25, .5, .75, .95]). T

Rendimiento esperado

En la versión 18.0, la función describe devolverá percentiles cuando las columnas contengan nan.

salida de pd.show_versions()

Pero en la versión 18.1, la función describe no devolverá percentiles cuando las columnas contengan nan.

Duplicate

Comentario más útil

Aquí hay un ejemplo reproducible (el problema real está en el método quantile ):

In [24]: s = pd.Series(range(5))

In [25]: s.quantile(0.5)
Out[25]: 2.0

In [26]: s[0] = np.nan

In [27]: s.quantile(0.5)
Out[27]: nan

In [28]: pd.__version__
Out[28]: '0.18.1+20.gaf7bdd3'

Todos 3 comentarios

@ tade0726 ¿Puede mostrar un ejemplo reproducible? (algún código que construye un marco de datos que muestra el problema)

Aquí hay un ejemplo reproducible (el problema real está en el método quantile ):

In [24]: s = pd.Series(range(5))

In [25]: s.quantile(0.5)
Out[25]: 2.0

In [26]: s[0] = np.nan

In [27]: s.quantile(0.5)
Out[27]: nan

In [28]: pd.__version__
Out[28]: '0.18.1+20.gaf7bdd3'

Y es un duplicado de https://github.com/pydata/pandas/issues/13098

Gracias por informar

¿Fue útil esta página
0 / 5 - 0 calificaciones