Pandas: BUG: groupby (.., as_index = False) avec un TimeGrouper

Créé le 8 août 2017 · 6Commentaires · Source: pandas-dev/pandas

Bonjour,

Je fais une agrégation de base et un boom, un bug étrange se produit.
Voici un reprex:

import pandas as pd
import numpy as np


idx2=[pd.to_datetime('2016-08-31 22:08:12.000') , 
     pd.to_datetime('2016-08-31 22:09:12.200'),
     pd.to_datetime('2016-08-31 22:20:12.400')]

test=pd.DataFrame({'quant':[1.0,1.0,3.0], 
                   'quant2':[1.0,1.0,3.0],
                   'time2':[pd.to_datetime('2016-08-31 22:08:12.000') , 
                             pd.to_datetime('2016-08-31 22:09:12.200'),
                             pd.to_datetime('2016-08-31 22:20:12.400')]}, 
                    index=idx2)
test.reset_index(inplace = True)

test
Out[22]: 
                    index  quant  quant2                   time2
0 2016-08-31 22:08:12.000    1.0     1.0 2016-08-31 22:08:12.000
1 2016-08-31 22:09:12.200    1.0     1.0 2016-08-31 22:09:12.200
2 2016-08-31 22:20:12.400    3.0     3.0 2016-08-31 22:20:12.400

df= test.groupby(pd.Grouper(key='time2', freq='1T', closed = 'left', label = 'left'),as_index = False).agg(
                     {'quant' : 'sum',
                      'quant2' : 'sum'})

donne

  File "<ipython-input-20-c09863316397>", line 19, in <module>
    'quant2' : 'sum'})

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4036, in aggregate
    return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 3491, in aggregate
    self._insert_inaxis_grouper_inplace(result)

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4090, in _insert_inaxis_grouper_inplace
    self.grouper.get_group_levels(),

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 1911, in get_group_levels
    if not self.compressed and len(self.groupings) == 1:

AttributeError: 'BinGrouper' object has no attribute 'compressed'

Est-ce prévu? Pourquoi le as_index = False générerait-il cette erreur?

Bug Groupby Resample

Source

randomgambit

👍2

Commentaire le plus utile

@randomgambit : Merci! Cela vous dérange-t-il de transférer ce code dans votre rapport de problème initial? Cela nous facilitera la lecture, même d'un simple coup d'œil.

gfyoung le 8 août 2017

🎉1 👍1

Tous les 6 commentaires

@randomgambit : Merci pour le rapport! Malheureusement, nous ne pouvons pas le reproduire car vous n'avez pas spécifié ce qu'était df . Pourriez-vous fournir cela dans votre exemple de code?

gfyoung le 8 août 2017

@randomgambit : Merci! Cela vous dérange-t-il de transférer ce code dans votre rapport de problème initial? Cela nous facilitera la lecture, même d'un simple coup d'œil.

gfyoung le 8 août 2017

🎉1 👍1

@gfyoung des idées?

randomgambit le 9 août 2017

cc @jreback

gfyoung le 9 août 2017

as_index n'est pas pris en charge lors de l'utilisation d'un TimeGrouper.

notez que votre exemple équivaut à

test.resample('1T', on='time2').sum()

Je suppose que cela devrait fonctionner.

jreback le 9 août 2017

cela fait plus de 3 ans que quelqu'un a appelé dibs à ce sujet, mais si vous voulez une solution de contournement rapide, j'ai pu projeter l'index col dans sa propre colonne avec un .reset_index() après l'agrégation:

df.groupby(pd.Grouper(key='date_col', freq='1d')).count().reset_index()

cpdean le 24 août 2020

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

Meilleur affichage du Timedelta négatif

scls19fr · 3Commentaires

AttributeError : impossible d'utiliser des pandas à partir d'un fichier de script

songololo · 3Commentaires

frame _apply_standard error lors du fonctionnement sur des valeurs 0 ou NaN

venuktan · 3Commentaires

Suffixes ignorés lors de la deuxième fusion

MatzeB · 3Commentaires

Incompatibilité entre pandas.infer_freq et pandas.to_timedelta

idanivanov · 3Commentaires