Pandas: ОШИБКА: groupby (.., as_index = False) с TimeGrouper

Созданный на 8 авг. 2017 · 6Комментарии · Источник: pandas-dev/pandas

Привет,

Я делаю базовую агрегацию и бум, возникает какая-то странная ошибка.
Вот представитель:

import pandas as pd
import numpy as np


idx2=[pd.to_datetime('2016-08-31 22:08:12.000') , 
     pd.to_datetime('2016-08-31 22:09:12.200'),
     pd.to_datetime('2016-08-31 22:20:12.400')]

test=pd.DataFrame({'quant':[1.0,1.0,3.0], 
                   'quant2':[1.0,1.0,3.0],
                   'time2':[pd.to_datetime('2016-08-31 22:08:12.000') , 
                             pd.to_datetime('2016-08-31 22:09:12.200'),
                             pd.to_datetime('2016-08-31 22:20:12.400')]}, 
                    index=idx2)
test.reset_index(inplace = True)

test
Out[22]: 
                    index  quant  quant2                   time2
0 2016-08-31 22:08:12.000    1.0     1.0 2016-08-31 22:08:12.000
1 2016-08-31 22:09:12.200    1.0     1.0 2016-08-31 22:09:12.200
2 2016-08-31 22:20:12.400    3.0     3.0 2016-08-31 22:20:12.400

df= test.groupby(pd.Grouper(key='time2', freq='1T', closed = 'left', label = 'left'),as_index = False).agg(
                     {'quant' : 'sum',
                      'quant2' : 'sum'})

дает

  File "<ipython-input-20-c09863316397>", line 19, in <module>
    'quant2' : 'sum'})

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4036, in aggregate
    return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 3491, in aggregate
    self._insert_inaxis_grouper_inplace(result)

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 4090, in _insert_inaxis_grouper_inplace
    self.grouper.get_group_levels(),

  File "C:\\Anaconda2\lib\site-packages\pandas\core\groupby.py", line 1911, in get_group_levels
    if not self.compressed and len(self.groupings) == 1:

AttributeError: 'BinGrouper' object has no attribute 'compressed'

Это ожидается? Почему as_index = False генерирует эту ошибку?

Bug Groupby Resample

Источник

randomgambit

👍2

Самый полезный комментарий

@randomgambit : Спасибо! Не возражаете ли вы перенести этот код в свой первоначальный отчет о проблеме? Это облегчит нам чтение даже с первого взгляда.

gfyoung 8 авг. 2017

🎉1 👍1

Все 6 Комментарий

@randomgambit : Спасибо за отчет! К сожалению, мы не можем воспроизвести это, потому что вы не указали, что было за df . Не могли бы вы указать это в своем образце кода?

gfyoung 8 авг. 2017

🎉1 👍1

@gfyoung есть идеи?

randomgambit 9 авг. 2017

cc @jreback

gfyoung 9 авг. 2017

as_index не поддерживается при использовании TimeGrouper.

обратите внимание, что ваш пример эквивалентен

test.resample('1T', on='time2').sum()

Я думаю, это должно сработать.

jreback 9 авг. 2017

Прошло более 3 лет с тех пор, как кто-то назвал dibs по этому поводу, но если вам нужен быстрый обходной путь, я смог спроецировать индекс col в его собственный столбец с .reset_index() после агрегирования:

df.groupby(pd.Grouper(key='date_col', freq='1d')).count().reset_index()

cpdean 24 авг. 2020

Была ли эта страница полезной?

0 / 5 - 0 рейтинги

Смежные вопросы

API: определение API для панд, строящих бэкенды

datapythonista · 44Комментарии

read_csv () в 3,5 раза медленнее в Pandas 0.23.4 на Python 3.7.1 по сравнению с Pandas 0.22.0 на Python 3.5.2

dragoljub · 56Комментарии

РЛС: 0.24.0

jreback · 61Комментарии

Замените старый синтаксис форматирования строк на f-строки

ShaharNaveh · 137Комментарии

[Хороший первый выпуск] TST: запретить использование только pytest.raises

ShaharNaveh · 51Комментарии