Pandas: عدم التوافق بين pandas.infer_freq و pandas.to_timedelta

تم إنشاؤها على ١١ أكتوبر ٢٠١٦  ·  3تعليقات  ·  مصدر: pandas-dev/pandas

مثال صغير وكامل للقضية

ناتج pd.infer_freq هو "D" بينما pd.to_timedelta يتوقع "1D".

import pandas as pd
dates = pd.date_range(start='2016-10-01', end='2016-10-10', freq='1D')
freq = pd.infer_freq(dates)
delta = pd.to_timedelta(freq)

الناتج المتوقع

delta = Timedelta ("1 يوم 00:00:00")

>>> import pandas as pd
>>> dates = pd.date_range(start='2016-10-01', end='2016-10-10', freq='1D')
>>> dates
DatetimeIndex(['2016-10-01', '2016-10-02', '2016-10-03', '2016-10-04',
               '2016-10-05', '2016-10-06', '2016-10-07', '2016-10-08',
               '2016-10-09', '2016-10-10'],
              dtype='datetime64[ns]', freq='D')
>>> freq = pd.infer_freq(dates)
>>> freq
'D'
>>> delta = pd.to_timedelta(freq)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/iivanov/anaconda2/lib/python2.7/site-packages/pandas/util/decorators.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "/home/iivanov/anaconda2/lib/python2.7/site-packages/pandas/tseries/timedeltas.py", line 102, in to_timedelta
    box=box, errors=errors)
  File "/home/iivanov/anaconda2/lib/python2.7/site-packages/pandas/tseries/timedeltas.py", line 148, in _coerce_scalar_to_timedelta_type
    result = tslib.convert_to_timedelta(r, unit, errors)
  File "pandas/tslib.pyx", line 2941, in pandas.tslib.convert_to_timedelta (pandas/tslib.c:52631)
  File "pandas/tslib.pyx", line 3256, in pandas.tslib.convert_to_timedelta64 (pandas/tslib.c:56028)
  File "pandas/tslib.pyx", line 3188, in pandas.tslib.parse_timedelta_string (pandas/tslib.c:54877)
ValueError: unit abbreviation w/o a number

ناتج pd.show_versions()

الإصدارات المثبتة

الالتزام: لا شيء
بيثون: 2.7.12.final.0
بتات الثعبان: 64
نظام التشغيل: Linux
إصدار نظام التشغيل: 4.4.0-42 عام
الجهاز: x86_64
المعالج: x86_64
byteorder: قليلا
LC_ALL: لا شيء
LANG: en_US.UTF-8

الباندا: 0.18.1
أنف: 1.3.7
النقطة: 8.1.2
أدوات الإعداد: 26.1.1
سايثون: 0.24.1
numpy: 1.11.1
scipy: 0.18.0
النماذج الإحصائية: 0.6.1
xarray: لا شيء
IPython: 5.1.0
أبو الهول: 1.4.1
باتسي: 0.4.1
داتوتيل: ​​2.5.3
بيتز: 2016.6.1
blosc: لا شيء
عنق الزجاجة: 1.1.0
الجداول: 3.2.3.1
numexpr: 2.6.1
matplotlib: 1.5.1
openpyxl: 2.3.2
xlrd: 1.0.0
xlwt: 1.1.2
xlsxwriter: 0.9.2
lxml: 3.6.4
BS4: 4.4.1
html5lib: لا شيء
HTplib2: لا شيء
apiclient: لا شيء
sqlalchemy: 1.0.13
pymysql: لا شيء
psycopg2: لا شيء
jinja2: 2.8
بوتو: 2.40.0
pandas_datareader: لا شيء

Frequency Usage Question

التعليق الأكثر فائدة

pd.to_timedelta فقط التعامل مع دلتا ثابتة (بشكل أساسي أيام وأدق) - إنه ليس ضمانًا لواجهة برمجة التطبيقات بأن سلاسل التردد يمكن تحليلها على أنها دلتا ، وفي الواقع لا يمكن تحويل بعض الترددات إلى دلتا زمنية.

In [254]: dates = pd.bdate_range(start='2014-01-01', periods=10)

In [255]: pd.infer_freq(dates)
Out[255]: 'B'

إذا كنت تريد تحويل سلسلة تردد إلى كائن DateOffset ، والذي يمكن أن يكون دلتا ثابتة أو نسبية ، فاستخدم الدالة to_offset .

In [253]: from pandas.tseries.frequencies import to_offset

In [256]: to_offset('D')
Out[256]: <Day>

In [257]: to_offset('2D')
Out[257]: <2 * Days>

In [258]: to_offset('B')
Out[258]: <BusinessDay>

ال 3 كومينتر

pd.to_timedelta فقط التعامل مع دلتا ثابتة (بشكل أساسي أيام وأدق) - إنه ليس ضمانًا لواجهة برمجة التطبيقات بأن سلاسل التردد يمكن تحليلها على أنها دلتا ، وفي الواقع لا يمكن تحويل بعض الترددات إلى دلتا زمنية.

In [254]: dates = pd.bdate_range(start='2014-01-01', periods=10)

In [255]: pd.infer_freq(dates)
Out[255]: 'B'

إذا كنت تريد تحويل سلسلة تردد إلى كائن DateOffset ، والذي يمكن أن يكون دلتا ثابتة أو نسبية ، فاستخدم الدالة to_offset .

In [253]: from pandas.tseries.frequencies import to_offset

In [256]: to_offset('D')
Out[256]: <Day>

In [257]: to_offset('2D')
Out[257]: <2 * Days>

In [258]: to_offset('B')
Out[258]: <BusinessDay>

راجع للشغل ، يمكنك تحويل مثل هذا الإزاحة إلى timedelta لأنواع معينة:

In [19]: pd.to_timedelta(to_offset('D'))
Out[19]: Timedelta('1 days 00:00:00')

In [20]: pd.to_timedelta(to_offset('B'))
...
ValueError: Invalid type for timedelta scalar: <class 'pandas.tseries.offsets.BusinessDay'>

(أو بديل to_offset('D').delta )
كما لاحظ @ chris-b1 أعلاه ، لا يمكن تحويل الإزاحات النسبية إلى timedelta ، لذا فإن هذا أيضًا أخطاء.

شكرا لك على التعليقات! من المنطقي الآن.

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات