Pandas: タイムスタンプ値のあるシリーズには適用できません

作成日 2017年08月03日  ·  3コメント  ·  ソース: pandas-dev/pandas

コードサンプル、可能であればコピーして貼り付けることができる例

import pandas as pd

ts = pd.Series([pd.Timestamp('2017-07-31 20:08:46.110998-04:00'), 
                pd.Timestamp('2017-08-01 20:08:46.110998-04:00'), 
                pd.Timestamp('2017-08-02 20:08:46.110998-04:00')])

def func(elem):
    print(type(elem))
    return elem
print(type(ts))
print(type(ts[0]))

ts.apply(func);

# Prints out:
# <class 'pandas.core.series.Series'>
# <class 'pandas._libs.tslib.Timestamp'>
# <class 'pandas.core.indexes.datetimes.DatetimeIndex'>

問題の説明

インデックスではなく値としてタイムスタンプを持つシリーズがあります。 applyメソッドが各要素で呼び出されることを期待していますが、そうではなく、DatetimeIndexで呼び出されます。

期待される出力





pd.show_versions()出力

インストールされたバージョン

コミット:なし
python:3.6.0.final.0
python-ビット:64
OS:ダーウィン
OSリリース:16.7.0
マシン:x86_64
プロセッサ:i386
バイトオーダー:少し
LC_ALL:なし
言語:en_CA.UTF-8
ローカル:en_CA.UTF-8

パンダ:0.20.2
pytest:3.0.5
ピップ:9.0.1
setuptools:35.0.1
Cython:なし
numpy:1.13.0
scipy:0.19.1
xarray:0.9.6
IPython:6.0.0
スフィンクス:1.5.3
patsy:なし
dateutil:2.6.0
pytz:2016.10
blosc:なし
ボトルネック:1.2.0
テーブル:なし
numexpr:なし
羽毛:なし
matplotlib:2.0.0
openpyxl:2.4.8
xlrd:1.0.0
xlwt:なし
xlsxwriter:0.9.8
lxml:なし
bs4:なし
html5lib:0.999
sqlalchemy:なし
pymysql:なし
psycopg2:なし
jinja2:2.9.5
s3fs:なし
pandas_gbq:なし
pandas_datareader:なし

Timezones Usage Question

全てのコメント3件

また、私のユースケースに関するいくつかの情報:

シリーズの各タイムスタンプにtz_localizeメソッドを適用したいと思います。 私はもともとシリーズ自体でtz_localizeを試しましたが、それは

TypeError: index is not a valid DatetimeIndex or PeriodIndex

reindexを使用することでこれを実現できることはわかっていますが、シリーズ値としてタイムスタンプを使用してこれを実現できるかどうか疑問に思いました。

@nathanielatomは、 dtアクセサーを介してシリーズでtz_localize / tz_convertを使用できます。

In [19]: ts.dt.tz_convert('UTC')
Out[19]: 
0   2017-08-01 00:08:46.110998+00:00
1   2017-08-02 00:08:46.110998+00:00
2   2017-08-03 00:08:46.110998+00:00
dtype: datetime64[ns, UTC]

さらに、 applyで表示される出力を取得する理由は、applyが最初にすべての値(シリーズの値ですが、DatetimeIndexとして内部で保持されている)に対して関数を呼び出そうとするためです。 )、それが失敗した場合にのみ、各要素で関数を呼び出します。

スカラー値を取得しないときに関数を少し上げて上げると、期待される出力が表示されます。

In [21]: def func(elem):
    ...:     assert not hasattr(elem, 'ndim')
    ...:     print(type(elem))
    ...:     return elem
    ...: 

In [22]: ts.apply(func)
<class 'pandas._libs.tslib.Timestamp'>
<class 'pandas._libs.tslib.Timestamp'>
<class 'pandas._libs.tslib.Timestamp'>
Out[22]: 
0   2017-07-31 20:08:46.110998-04:00
1   2017-08-01 20:08:46.110998-04:00
2   2017-08-02 20:08:46.110998-04:00
dtype: datetime64[ns, pytz.FixedOffset(-240)]
このページは役に立ちましたか?
0 / 5 - 0 評価