Pandas: RLS: 0.20.0

Dibuat pada 18 Apr 2017  ·  50Komentar  ·  Sumber: pandas-dev/pandas

Kami mendekati rilis 0.20.0, jadi membuka masalah untuk melacak ini.

Masalah/PR yang tersisa dengan tag 0.20: https://github.com/pandas-dev/pandas/milestones/0.20.0
Jika ada hal lain yang tersisa, saatnya untuk berbicara

cc @pandas-dev/pandas-core

Release

Komentar yang paling membantu

Kandidat rilis 0.20.0 memecahkan banyak kode saya dan kerusakan AFAICS ada di modul yang sebelumnya tidak digunakan sehingga perpustakaan pihak ke-3 tidak punya waktu untuk beradaptasi dengan api baru.

xref: #16138, #16138

Saya pikir harus ada pertimbangan serius yang diberikan untuk menyediakan lapisan kompatibilitas untuk setidaknya satu rilis kecil. Ini tidak sulit untuk dilakukan dan tidak perlu bertahan lama, tetapi akan memberikan perpustakaan pihak ke-3 perubahan untuk beradaptasi. Pekerjaan yang dibutuhkan ada di PR #16140

Semua 50 komentar

Target saat ini untuk kandidat rilis adalah Jumat ini saya pikir, @TomAugspurger ?

Ya, itulah tujuannya.

ini hanya RC jumat ini. Kami mungkin membutuhkan 2 minggu atau lebih untuk itu.

ya itu maksud saya, maaf atas kebingungannya

Melakukan RC malam ini atau besok pagi. Dari masalah yang tersisa, #16088 adalah pemblokir dan #16086 akan menyenangkan. Adakah saya yang hilang?

@jreback apakah Anda memiliki preferensi untuk menandai v0.21.dev segera setelah menandai RC, dibandingkan menunggu untuk menandai v0.21.dev hingga rilis 0,20 penuh? Jika kita menandai 0.21.dev sekarang maka kita dapat menggabungkan apa pun yang kita inginkan menjadi master, dan saya hanya akan mem-backport apa pun yang perlu di-backport antara sekarang dan rilis 0.20.

tidak, itu baik-baik saja. Saya akan melihat beberapa.

hmm rasanya aneh untuk menandai 0.21.dev sebelum 0.20.0.

hmm rasanya aneh untuk menandai 0.21.dev sebelum 0.20.0.

Saya rasa tidak ada yang aneh dengan itu. Ini hanyalah pilihan praktis untuk dibuat ketika kita mencabangkan cabang 0.20.x (penandaan hanyalah konsekuensi dari itu): sekarang dengan rc, atau hanya setelah rilis final.

Bagi saya kedua opsi itu OK. Percabangan sekarang membuatnya sedikit lebih mudah untuk memajukan / menggabungkan PR (kita tidak perlu khawatir tentang PR mana yang kita gabungkan, atau yang harus menunggu hingga 0,20 keluar), tetapi lebih banyak pekerjaan bagi Tom untuk melakukan backport.

@TomAugspurger masih ada beberapa masalah dokumen yang terbuka untuk 0.20, tetapi Anda tidak perlu terlalu mengkhawatirkannya, karena untuk rc kami biasanya menunjuk ke dokumen dev yang diperbarui lebih lanjut (maksud saya, menandai rc tidak membekukan docs, seperti halnya dengan rilis final)

ok terbuka untuk penandaan apa pun yang masuk akal.

ya masalah doc pasti bisa dilakukan setelahnya (serta sejumlah kecil perbaikan tambahan, sudah ditandai untuk 0.20.0). terutama yang menyortir.

@TomAugspurger ok semua hal di daftar saya digabungkan.

👍 Membangun sekarang dan menguji secara lokal. Saya mungkin akan menandai malam ini.

Conda-forge belum menyelesaikan hal-hal pra-rilis, jadi saya mungkin akan menunggu sampai besok untuk membuat pengumuman (harus menyelesaikan pengaturan VM windows ini).

ok lmk jika kamu butuh sesuatu
meskipun tidak akan ada di sekitar sebagian besar besok

Ok, diberi tag dan rilis di github. Melakukan semua hal conda dan pengumuman milis besok.

Baru saja mengirim email pengumuman. Semua roda ada di PyPI. Saluran conda kami memiliki paket untuk OSX dan jendela 64-bit. Saya belum menyiapkan lingkungan windows 32-bit. Paket Linux akan segera tersedia (dibangun 0.19.2 secara tidak sengaja).

terima kasih @TomAugspurger !

Karena kita tidak menandai 0.21.0.dev (saya pikir kita harus melakukan ini setelah tag 0.20.0 final), maka akan melanjutkan menggabungkan hal-hal kecil untuk dikuasai.

Bisakah #16111 diperbaiki sebelum 0.20.final? Ini adalah bug yang menyebabkan Pandas membuat crash seluruh interpreter Python, tanpa meninggalkan jejak atau petunjuk apa yang salah.

Saya tidak memiliki kemampuan untuk memperbaikinya sendiri, jadi anggap ini hanya permohonan dari pengguna yang senang. Juga, saya telah membuat solusi saya sendiri (tidak optimal), tetapi ini dapat membawa kejutan negatif bagi orang lain ketika itu terjadi ...

EDIT: Ini telah diurus. Terima kasih!

Kandidat rilis 0.20.0 memecahkan banyak kode saya dan kerusakan AFAICS ada di modul yang sebelumnya tidak digunakan sehingga perpustakaan pihak ke-3 tidak punya waktu untuk beradaptasi dengan api baru.

xref: #16138, #16138

Saya pikir harus ada pertimbangan serius yang diberikan untuk menyediakan lapisan kompatibilitas untuk setidaknya satu rilis kecil. Ini tidak sulit untuk dilakukan dan tidak perlu bertahan lama, tetapi akan memberikan perpustakaan pihak ke-3 perubahan untuk beradaptasi. Pekerjaan yang dibutuhkan ada di PR #16140

Itulah sebabnya kami ingin orang-orang menguji dengan rc, terima kasih banyak atas tanggapan Anda @dhirschfeld !

Ada masalah/perbaikan yang tersisa yang diinginkan orang untuk 0,20? https://github.com/pandas-dev/pandas/pull/16171 adalah satu-satunya pemblokir yang saya lihat.

Saya mungkin akan melakukan rilis Selasa atau Rabu jika itu berhasil untuk semua orang.

setelah #16223 dan perbaikan dokumen yang tersisa, saya pikir itu bagus untuk dilakukan. Kita bisa melakukan rc2 (mungkin hanya paket conda). Untuk pemeriksaan cepat? terserah kamu @TomAugspurger

Ya, saya bisa menggunakan RC2... Mungkin seperti yang dilakukan hanya untuk paket conda, dan uji terhadap dask, statsmodels, dll.

yakin itu berhasil.

Haruskah saya mendorong RC2 ke PyPI? Atau cukup beri tag, Dorong ke github, lalu buat conda pkgs?

tidak, saya hanya akan membuat beberapa paket conda.

Akan melakukan RC2 sekarang.

Kami memiliki dua masalah dokumen yang luar biasa, tetapi itu dapat terjadi di antara RC2 dan rilis.

Saya memulai kembali pada master. ini harus bekerja. Saya merilis versi baru gbq karena menggunakan PandasError (yang kami hapus)

gbq ini terkadang gagal jika banyak hal yang bertentangan dengannya (misalnya tag & master 0.20rc2 diluncurkan pada saat yang bersamaan).

Dask, statsmodels, dan seaborn semuanya tampak OK di rc2. Saya melakukan pembuatan dan pengujian windows secara lokal, dan itu juga lulus.

hebat @TomAugspurger

ya master berwarna hijau sekarang (dan rc2 saya baru saja me-restart build itu).

Saya mendapatkan tiga kegagalan pengujian pada win-AMD64-py3.6.1 dengan numpy-1.11.3+mkl. Kegagalan test_shim diperbaiki oleh #16239

running: pytest --skip-slow --skip-network X:\Python36\lib\site-packages\pandas
<snip>
================================== FAILURES ===================================
__________________________________ test_shim __________________________________

    def test_shim():
        # https://github.com/pandas-dev/pandas/pull/16059
        # Remove in 0.21
        with tm.assert_produces_warning(FutureWarning,
                                        check_stacklevel=False):
>           from pandas.formats.style import Styler as _styler  # noqa
E           ModuleNotFoundError: No module named 'pandas.formats'

X:\Python36\lib\site-packages\pandas\tests\io\formats\test_style.py:866: ModuleNotFoundError
______________________ TestSeriesAnalytics.test_overflow ______________________

self = <pandas.tests.series.test_analytics.TestSeriesAnalytics object at 0x0000019B01E52400>

    def test_overflow(self):
        # GH 6915
        # overflowing on the smaller int dtypes
        for dtype in ['int32', 'int64']:
            v = np.arange(5000000, dtype=dtype)
            s = Series(v)

            # no bottleneck
            result = s.sum(skipna=False)
            assert int(result) == v.sum(dtype='int64')
            result = s.min(skipna=False)
            assert int(result) == 0
            result = s.max(skipna=False)
            assert int(result) == v[-1]

            # use bottleneck if available
            result = s.sum()
>           assert int(result) == v.sum(dtype='int64')
E           AssertionError: assert 1642668640 == 12499997500000
E            +  where 1642668640 = int(1642668640)
E            +  and   12499997500000 = <built-in method sum of numpy.ndarray object at 0x0000019B061C0CB0>(dtype='int64')
E            +    where <built-in method sum of numpy.ndarray object at 0x0000019B061C0CB0> = array([      0,       1,       2, ..., 4999997, 4999998, 4999999], dtype=int64).sum

X:\Python36\lib\site-packages\pandas\tests\series\test_analytics.py:69: AssertionError
________________________ TestSeriesAnalytics.test_sum _________________________

self = <pandas.tests.series.test_analytics.TestSeriesAnalytics object at 0x0000019B69C32EB8>

    def test_sum(self):
>       self._check_stat_op('sum', np.sum, check_allna=True)

X:\Python36\lib\site-packages\pandas\tests\series\test_analytics.py:96:
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
X:\Python36\lib\site-packages\pandas\tests\series\test_analytics.py:556: in _check_stat_op
    testit()
X:\Python36\lib\site-packages\pandas\tests\series\test_analytics.py:535: in testit
    assert_almost_equal(float(f(s)), float(alternate(s.values)))
X:\Python36\lib\site-packages\pandas\util\testing.py:177: in assert_almost_equal
    **kwargs)
pandas\_libs\testing.pyx:59: in pandas._libs.testing.assert_almost_equal (pandas\_libs\testing.c:4156)
    ???
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

>   ???
E   AssertionError: expected 1099511628275500.00000 but got 499500.00000, with decimal 5

pandas\_libs\testing.pyx:209: AssertionError
=========================== pytest-warning summary ============================
WC1 X:\Python36\lib\site-packages\pandas\tests\test_config.py cannot collect test class 'TestConfig' because it has a __init__ constructor
 3 failed, 9606 passed, 542 skipped, 21 xfailed, 1 xpassed, 1 pytest-warnings in 631.87 seconds

@cgohlke terima kasih. Apakah itu di windows 32-bit?

Ini adalah 64-bit Python 3.6.1 dari python.org di Windows 10.

test_overflow dan test_sum lulus setelah menghapus bottleneck-1.2.0.

test_overflow dan test_sum lulus setelah mencopot bottleneck-1.2.0.

Terima kasih, saya dapat mereproduksi VM windows saya dengan bottleneck yang diinstal (saya tidak menginstalnya sebelumnya). Melihat apa yang terjadi sekarang.

kami mungkin tidak menginstal bottleneck untuk build pengujian windows

lewati saja untuk saat ini

kami menguji pada 2,7 w/bottleneck di windows, tetapi bukan 3,6....akan menambah dan melewati/memperbaikinya.

kami menguji pada 2,7 w/bottleneck di windows, tetapi bukan 3,6....akan menambah dan melewati/memperbaikinya.

Ya, itu pasti dalam kemacetan. Apakah Anda melakukan PR untuk melewatkan itu, atau haruskah saya?

pengujian sekarang

xgagal tes ini: https://ci.appveyor.com/project/jreback/pandas/build/1.0.3686
penggabungan secara terus-menerus (saya pikir kami memiliki masalah tentang luapan ini dalam hal apa pun, di sini: https://github.com/pandas-dev/pandas/issues/15453)

jadi ketika saya memperbaiki hal-hal bottlneck di 0.21.0 akan memperbaikinya.

@jreback terima kasih masalah kemacetan ada di sini: https://github.com/kwgoodman/bottleneck/issues/163

@TomAugspurger ok semuanya lgtm. dengan asumsi master selesai dan lulus. potong saat Anda siap. (jelas jika Anda melihat hal-hal doc ketika Anda lakukan, pls perbaikan push).

@jreback the whatsnew menyebutkan hash_tuples baru. Apakah kita ingin mengeksposnya dalam pandas.util bersama dengan hash_pandas_object ?

itu bukan untuk umum mungkin saya kira

Saya hanya bertanya karena itu ada di item catatan rilis. Padahal, dask tidak menggunakannya, jadi mungkin merahasiakannya untuk saat ini?

ya dimaksudkan untuk menjadi pribadi

PL - tanggal catatan apa yang perlu diubah

Dapatkan di https://github.com/pandas-dev/pandas/pull/16245

Saya akan mendorong satu komit lagi untuk menghapus referensi itu ke hash_tuples , lalu menandainya. Akan menunggu pembuatan dokumen itu selesai terlebih dahulu.

Apakah 0.20 telah dirilis? pandas.pydata.org mengatakan 0.19.2 adalah rilis saat ini..

hanya menyegarkan dan Anda akan melihat.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat