Bonjour,
Je fais une agrégation de base et un boom, un bug étrange se produit.
Voici un reprex:
import pandas as pd
import numpy as np
idx2=[pd.to_datetime('2016-08-31 22:08:12.000') ,
pd.to_datetime('2016-08-31 22:09:12.200'),
pd.to_datetime('2016-08-31 22:20:12.400')]
test=pd.DataFrame({'quant':[1.0,1.0,3.0],
'quant2':[1.0,1.0,3.0],
'time2':[pd.to_datetime('2016-08-31 22:08:12.000') ,
pd.to_datetime('2016-08-31 22:09:12.200'),
pd.to_datetime('2016-08-31 22:20:12.400')]},
index=idx2)
test.reset_index(inplace = True)
test
Out[22]:
index quant quant2 time2
0 2016-08-31 22:08:12.000 1.0 1.0 2016-08-31 22:08:12.000
1 2016-08-31 22:09:12.200 1.0 1.0 2016-08-31 22:09:12.200
2 2016-08-31 22:20:12.400 3.0 3.0 2016-08-31 22:20:12.400
df= test.groupby(pd.Grouper(key='time2', freq='1T', closed = 'left', label = 'left'),as_index = False).agg(
{'quant' : 'sum',
'quant2' : 'sum'})
donne
File "<ipython-input-20-c09863316397>", line 19, in <module>
'quant2' : 'sum'})
File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4036, in aggregate
return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)
File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 3491, in aggregate
self._insert_inaxis_grouper_inplace(result)
File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4090, in _insert_inaxis_grouper_inplace
self.grouper.get_group_levels(),
File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 1911, in get_group_levels
if not self.compressed and len(self.groupings) == 1:
AttributeError: 'BinGrouper' object has no attribute 'compressed'
Est-ce prévu? Pourquoi le as_index = False
générerait-il cette erreur?
@randomgambit : Merci pour le rapport! Malheureusement, nous ne pouvons pas le reproduire car vous n'avez pas spécifié ce qu'était df
. Pourriez-vous fournir cela dans votre exemple de code?
@randomgambit : Merci! Cela vous dérange-t-il de transférer ce code dans votre rapport de problème initial? Cela nous facilitera la lecture, même d'un simple coup d'œil.
@gfyoung des idées?
cc @jreback
as_index
n'est pas pris en charge lors de l'utilisation d'un TimeGrouper.
notez que votre exemple équivaut à
test.resample('1T', on='time2').sum()
Je suppose que cela devrait fonctionner.
cela fait plus de 3 ans que quelqu'un a appelé dibs à ce sujet, mais si vous voulez une solution de contournement rapide, j'ai pu projeter l'index col dans sa propre colonne avec un .reset_index()
après l'agrégation:
df.groupby(pd.Grouper(key='date_col', freq='1d')).count().reset_index()
Commentaire le plus utile
@randomgambit : Merci! Cela vous dérange-t-il de transférer ce code dans votre rapport de problème initial? Cela nous facilitera la lecture, même d'un simple coup d'œil.