Pandas: ERROR: groupby (.., as_index = False) con un TimeGrouper

Creado en 8 ago. 2017 · 6Comentarios · Fuente: pandas-dev/pandas

Hola,

Estoy haciendo una agregación básica y boom, se produce un error extraño.
Aquí hay un reprex:

import pandas as pd
import numpy as np


idx2=[pd.to_datetime('2016-08-31 22:08:12.000') , 
     pd.to_datetime('2016-08-31 22:09:12.200'),
     pd.to_datetime('2016-08-31 22:20:12.400')]

test=pd.DataFrame({'quant':[1.0,1.0,3.0], 
                   'quant2':[1.0,1.0,3.0],
                   'time2':[pd.to_datetime('2016-08-31 22:08:12.000') , 
                             pd.to_datetime('2016-08-31 22:09:12.200'),
                             pd.to_datetime('2016-08-31 22:20:12.400')]}, 
                    index=idx2)
test.reset_index(inplace = True)

test
Out[22]: 
                    index  quant  quant2                   time2
0 2016-08-31 22:08:12.000    1.0     1.0 2016-08-31 22:08:12.000
1 2016-08-31 22:09:12.200    1.0     1.0 2016-08-31 22:09:12.200
2 2016-08-31 22:20:12.400    3.0     3.0 2016-08-31 22:20:12.400

df= test.groupby(pd.Grouper(key='time2', freq='1T', closed = 'left', label = 'left'),as_index = False).agg(
                     {'quant' : 'sum',
                      'quant2' : 'sum'})

  File "<ipython-input-20-c09863316397>", line 19, in <module>
    'quant2' : 'sum'})

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4036, in aggregate
    return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 3491, in aggregate
    self._insert_inaxis_grouper_inplace(result)

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4090, in _insert_inaxis_grouper_inplace
    self.grouper.get_group_levels(),

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 1911, in get_group_levels
    if not self.compressed and len(self.groupings) == 1:

AttributeError: 'BinGrouper' object has no attribute 'compressed'

¿Es eso esperado? ¿Por qué as_index = False generaría este error?

Bug Groupby Resample

Fuente

randomgambit

👍2

Comentario más útil

@randomgambit : ¡Gracias! ¿Le importaría trasladar ese código a su informe de problemas inicial? Eso nos facilitará la lectura, incluso de un vistazo.

gfyoung en 8 ago. 2017

🎉1 👍1

Todos 6 comentarios

@randomgambit : ¡Gracias por el informe! Desafortunadamente, no podemos replicar esto porque no especificaste qué era df . ¿Podría proporcionar eso en su código de muestra?

gfyoung en 8 ago. 2017

@randomgambit : ¡Gracias! ¿Le importaría trasladar ese código a su informe de problemas inicial? Eso nos facilitará la lectura, incluso de un vistazo.

gfyoung en 8 ago. 2017

🎉1 👍1

@gfyoung ¿ alguna idea?

randomgambit en 9 ago. 2017

cc @jreback

gfyoung en 9 ago. 2017

as_index no es compatible cuando se usa un TimeGrouper.

tenga en cuenta que su ejemplo es equivalente a

test.resample('1T', on='time2').sum()

Supongo que esto debería funcionar.

jreback en 9 ago. 2017

Han pasado más de 3 años desde que alguien llamó a dibs sobre esto, pero si desea una solución rápida, pude proyectar la columna de índice en su propia columna con un .reset_index() después de la agregación:

df.groupby(pd.Grouper(key='date_col', freq='1d')).count().reset_index()

cpdean en 24 ago. 2020

¿Fue útil esta página

0 / 5 - 0 calificaciones

Temas relacionados

Sufijos ignorados en la segunda combinación

MatzeB · 3Comentarios

frame _apply_standard error cuando se opera con valores 0 o NaN

venuktan · 3Comentarios

read_csv (filename_with_asian_locale) falló en Python 3.6 para Windows

mfmain · 3Comentarios

to_sql UnicodeEncodeError

matthiasroder · 3Comentarios

No se puede usar aplicar en series con valores de marca de tiempo

nathanielatom · 3Comentarios