Pandas: RLS:1.0.4

创建于 2020-04-05  ·  53评论  ·  资料来源: pandas-dev/pandas

自 1.0.3 以来,我们报告了几个回归(不是由于 1.0.3,因为 0.25.3)和一些尚未修复的回归。

https://github.com/pandas-dev/pandas/issues?page=1&q=is%3Aopen+is%3Aissue+label%3ARegression

是否有任何保证 1.0.4 版本?

@pandas-dev/pandas-core

Release

最有用的评论

是的,一个志愿者项目,和其他许多项目一样,这很清楚

发布程序/回归不是开发过程的一部分,我猜项目中的新手可以真正提供帮助

有时(通常)开发人员不了解问题的严重性,因此项目用户明确表达担忧会有所帮助,至少有时是这样。

请理解我们的担忧

有很多领域你可以提供帮助,你为什么不去那里做志愿者呢?

我确实非常了解问题的严重性并且很同情但没有任何实际指导资源的方式,您的评论没有意义。

就像,让我们不要为任何东西付费,不要提供实物,但要大胆要求某些东西。

所有53条评论

本周我可能无法提供帮助,但https://github.com/pandas-dev/pandas-release 上的脚本应该是最新的。

我们需要手动验证所有必要的 PR 是否已被反向移植(我认为他们没有)。 尽快发布 1.1 版本可能会更容易。

这周我可能帮不上忙

我认为这并不紧急。 更重要的是我们是否应该将修复回归的 PR 标记为 1.0.4 和向后移植。

尽快发布 1.1 版本可能会更容易。

IMO 我们应该确保 1.0.x 修复了 0.25.3 的回归。 1.1 可能会引入新的回归。 所以这是为了确保受影响用户的升级路径。

@simonjayhawkins我认为在上周的电话会议中,我们决定把它留给你。 如果您有时间通过​​并向后移植必要的 PR 以进行发布,我们可以继续进行。

除了向后移植,我认为

是阻滞剂。

潜在的向后移植(添加到此列表中)

  • [x] #33462(1.0.2 中的回归)

@simonjayhawkins还在研究这个吗?

当这个问题被打开时,没有 PRs 合并来掌握修复回归。 发布版本也有障碍, https: //github.com/pandas-dev/pandas/issues/33300#issuecomment -614069516。

我没有一直在研究这个,但现在我们已经过了几个星期,障碍已经解决,我们现在有几个 PR _可以_被反向移植。

如果我们可能会发布 1.0.4 版本,我可以开始向后移植这些。

在这一点上,我认为在一两周内推动 1.1 版本可能更容易。

我实际上会在 1.0.4 上 +1; 我也认为这与做 1.1 是正交的,并且有利于其他人尝试发布。

除了向后移植,我认为

是阻滞剂。

32737 没有被反向移植,所以 #33210 不应该是这里的问题吗?

@jorisvandenbossche在 Linux py37_locale 的 1.0.x 上有一个 to_feather 测试失败。 pyarrow 0.17 正在安装。 见https://dev.azure.com/pandas-dev/pandas/_build/results?buildId=34788&view=logs&j=a3a13ea8-7cf0-5bdb-71bb-6ac8830ae35c

此测试通过的此分支上先前构建的日志无法用于确认 pyarrow 版本。

我找不到任何最近的 PR 来为此修复 ci。 也许#33422 解决了这个问题。

在 Windows 上,conda 未安装 pyarrow 0.17,因此无法重现失败,测试通过 0.16

$ conda install pyarrow==0.17.0 -c conda-forge
Collecting package metadata (repodata.json): done
Solving environment: \ 
The environment is inconsistent, please check the package plan carefully
The following packages are causing the inconsistency:

  - conda-forge/win-64::fastparquet==0.3.3=py38hc8d92b1_0
  - conda-forge/win-64::pyarrow==0.16.0=py38h57df961_2
  - conda-forge/win-64::pyreadstat==0.3.3=py38h11373af_0
  - conda-forge/noarch::seaborn==0.10.1=py_0
  - conda-forge/win-64::statsmodels==0.11.1=py38h9de7a3e_1
  - conda-forge/noarch::xarray==0.15.1=py_0
done

## Package Plan ##

  environment location: C:\Users\simon\Anaconda3\envs\pandas-dev

  added / updated specs:
    - pyarrow==0.17.0


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    arrow-cpp-0.16.0           |py38h5a970ca_5_cpu        11.8 MB  conda-forge
    openssl-1.1.1g             |       he774522_0         5.7 MB  conda-forge
    ------------------------------------------------------------
                                           Total:        17.5 MB

The following NEW packages will be INSTALLED:

  pandas             conda-forge/win-64::pandas-1.0.3-py38he6e81aa_1

The following packages will be UPDATED:

  arrow-cpp                           0.16.0-py38h5a970ca_4 --> 0.16.0-py38h5a970ca_5_cpu
  ca-certificates     pkgs/main::ca-certificates-2020.1.1-0 --> conda-forge::ca-certificates-2020.4.5.1-hecc5488_0

The following packages will be SUPERSEDED by a higher-priority channel:

  certifi              pkgs/main::certifi-2020.4.5.1-py38_0 --> conda-forge::certifi-2020.4.5.1-py38h32f6830_0
  openssl                                         pkgs/main --> conda-forge


Proceed ([y]/n)? y


Downloading and Extracting Packages
openssl-1.1.1g       | 5.7 MB    | ################################################################################################################# | 100%  
arrow-cpp-0.16.0     | 11.8 MB   | ################################################################################################################# | 100%  
Preparing transaction: done
Verifying transaction: done
Executing transaction: done
(pandas-dev) 
$ conda list pyarrow
# packages in environment at C:\Users\simon\Anaconda3\envs\pandas-dev:
#
# Name                    Version                   Build  Channel
pyarrow                   0.16.0           py38h57df961_2    conda-forge
(pandas-dev)

如果 Simon 愿意,也可以在发布 1.0.4 版本时 +1。

Linux py37_locale 在 1.0.x 上有一个 to_feather 测试失败。 pyarrow 0.17 正在安装

https://github.com/pandas-dev/pandas/pull/33422确实可以解决这个问题,因为我在那里更改了一些测试。 我认为 PR 应该可以向后移植(实际代码更改是有限的,只是通过关键字,或者也可以限制为仅向后移植测试修复)
如果你愿意,我可以看看这个。

或者也可以限制为仅向后移植测试修复

会这样做,只是为了让 ci 现在通过 1.0.x 分支。 一旦分支准备好接受向后移植,我们就可以讨论可以/应该向后移植什么。 (例如,#32611 修复了回归(#33058),但可能不适合向后移植。)

伙计们,你们能否推动 1.0.4 的发布(至少,请不要将它推迟到 1.1.0 之后,正如我在上次开发会议纪要中看到的那样)或者对它多加一些爱?

rolling,min/max 中的内存泄漏很严重,您是否知道在此期间全球数千个使用 Pandas 的应用程序崩溃,直到我们这些 Pandas 用户可以使用修复程序?

伙计们,你们能否推动 1.0.4 的发布(至少,请不要将它推迟到 1.1.0 之后,正如我在上次开发会议纪要中看到的那样)或者对它多加一些爱?

rolling,min/max 中的内存泄漏很严重,您是否知道在此期间全球数千个使用 Pandas 的应用程序崩溃,直到我们这些 Pandas 用户可以使用修复程序?

@hroff-1902

pandas 是一个全志愿者项目; 欢迎你帮忙

像上面这样的评论根本没有帮助

是的,一个志愿者项目,和其他许多项目一样,这很清楚

发布程序/回归不是开发过程的一部分,我猜项目中的新手可以真正提供帮助

有时(通常)开发人员不了解问题的严重性,因此项目用户明确表达担忧会有所帮助,至少有时是这样。

请理解我们的担忧

@hroff-1902 您是否一直在关注@simonjayhawkins为准备 1.0.4 版本所做的大量工作?

同时,我们在https://github.com/macpython/pandas-wheels 上的轮子构建基础设施阻止了发布https://github.com/pandas-dev/pandas/issues/34114需要修复才能发布。 你能看看吗?

是的,一个志愿者项目,和其他许多项目一样,这很清楚

发布程序/回归不是开发过程的一部分,我猜项目中的新手可以真正提供帮助

有时(通常)开发人员不了解问题的严重性,因此项目用户明确表达担忧会有所帮助,至少有时是这样。

请理解我们的担忧

有很多领域你可以提供帮助,你为什么不去那里做志愿者呢?

我确实非常了解问题的严重性并且很同情但没有任何实际指导资源的方式,您的评论没有意义。

就像,让我们不要为任何东西付费,不要提供实物,但要大胆要求某些东西。

@simonjayhawkins我赞成尽快发布这个。 无需等待任何其他补丁。 时序与 1.1 正交。 如果真的真的需要/想要总是可以做 1.0.5。

唯一真正的要求是通过 CI 和制造轮子的能力(我认为已经满足了)。

我认为 #32479 和 #33644 都已准备好合并。 然后可以向后移植这些。 我认为向后移植 #33644 很重要,因为会产生不正确的结果。

我们可以完成第二个(第一个已经合并)但通常很小的边缘情况,即使回归不值得拖延

@simonjayhawkins剩余问题已合并。

@simonjayhawkins剩余问题已合并。

反向移植。

TestToGBQIntegrationWithServiceAccountKeyPath 在 1.0.x ci 上失败,否则为绿色。

我在向后移植时注意到一个现存的 lint 错误并包含在 #34369 中。 github 操作不在 1.0.x 分支上运行。 这是拦截器吗?

@TomAugspurger

本周我可能无法提供帮助,但https://github.com/pandas-dev/pandas-release 上的脚本应该是最新的。

我使用的是 Windows 笔记本电脑,因此无法运行现成的脚本。

在过去的几天里一直在取得进展,可能可以开始发布过程。

我目前无法改进发布脚本以与 Windows 一起使用,因为我使用的是慢速计量移动连接,这使得从头开始测试变得不切实际。 即构建pandas-docs 容器需要3 个多小时。

所以,这是一个风险问题。 我很高兴开始发布过程,或者让其他人来做。

在为 docker 容器共享卷并且无法从 git bash 共享卷(以便能够使用 make)时,主要的问题似乎正在处理行尾

嗯。。。好吧。 太糟糕了,脚本不能开箱即用:/

我会尝试在接下来的一两天里断断续续地解决问题。 还有什么需要反向移植的吗?

还有什么需要反向移植的吗?

ac44c5de19c018a06d5345e800235bcb645cc842 希望应该是标记之前的最后一次提交。

@TomAugspurger

来自发布文档

现在手动创建一个发布https://github.com/pandas-dev/pandas/releases

确保将 pandas/dist/ 中的 sdist 作为“二进制”上传。 Conda-forge 使用它。

对于以前的版本,有三个资产。 另外两个是自动创建的吗?

是的,github 制作了这些。

@TomAugspurger

scripts\conda-forge.sh 失败

Traceback (most recent call last):
  File "C:\Users\simon\Anaconda3\envs\pandas-release\Scripts\conda-smithy-script.py", line 9, in <module>
    sys.exit(main())
  File "C:\Users\simon\Anaconda3\envs\pandas-release\lib\site-packages\conda_smithy\cli.py", line 584, in main
    args.subcommand_func(args)
  File "C:\Users\simon\Anaconda3\envs\pandas-release\lib\site-packages\conda_smithy\cli.py", line 391, in __call__
    self._call(args, tmpdir)
  File "C:\Users\simon\Anaconda3\envs\pandas-release\lib\site-packages\conda_smithy\cli.py", line 402, in _call
    temporary_directory=temporary_directory,
  File "C:\Users\simon\Anaconda3\envs\pandas-release\lib\site-packages\conda_smithy\configure_feedstock.py", line 1893, in main
    conda_build_version,
  File "C:\Users\simon\Anaconda3\envs\pandas-release\lib\site-packages\conda_smithy\configure_feedstock.py", line 1611, in commit_changes
    subprocess.check_call(git_args, cwd=forge_file_directory)
  File "C:\Users\simon\Anaconda3\envs\pandas-release\lib\subprocess.py", line 363, in check_call
    raise CalledProcessError(retcode, cmd)
subprocess.CalledProcessError: Command '['git', 'commit', '-m', 'MNT: Re-rendered with conda-build 3.19.2, conda-smithy 3.7.3, and conda-forge-pinning 2020.05.27.14.19.32', '--edit', '--status', '--verbose']' returned non-zero exit status 1.
make: *** [Makefile:136: conda-forge] Error 1

到目前为止,我遇到了一些与 git 相关的问题。

我认为是因为它在 conda 环境中

如果我删除它, conda-forge.sh 会重新安装它。

接下来会尝试轮子,我会回到这个。 也许你可以做 conda 的东西,或者我可以尝试构建一个 docker 容器来完成这一步。

谢谢。 我想我在 conda env 中也遇到了 git 问题。

我现在开始构建文档。

我现在开始构建文档。

凉爽的。 刚刚为 git bash 安装了 rsync。 将需要 ssh 访问权限才能继续,但只能算了。 明天继续做剩下的事情。

网站和文档已上传。 如果您发现任何奇怪的格式问题,请告诉我。 我第一次访问文档页面时布局混乱,但现在似乎没问题。

Wheels 在 PyPI 上,conda-forge 包正在构建。

@simonjayhawkins是否要将带有公告的电子邮件发送到邮件列表?

我仍然看到符号链接的布局混乱,例如https://pandas.pydata.org/docs/(https://pandas.pydata.org/pandas-docs/version/1.0.4/很好)。

嗯,我得跑一会儿,所以我现在会恢复符号链接。

@simonjayhawkins是否要将带有公告的电子邮件发送到邮件列表?

很高兴在我们高兴的时候做这件事,一切都很好

https://pandas.pydata.org/上 1.0.4 的新内容指向https://pandas.pydata.org/docs/whatsnew/v1.0.0.html

这是我需要改变的东西吗?

不,它已经固定在主人身上,所以我不担心。

仅供参考,我正在https://pandas.pydata.org/pandas-docs/debug/调试它

https://pandas.pydata.org/pandas-docs/debug/现在对我来说很好。 那个网址应该是一个“损坏的”网址吗? (在这种情况下,现在可能会解决)

不确定是否有人注意到但@simonjayhawkins点单击主页上的 1.0.4

image

那是因为链接似乎是在主页中硬编码的(而文本会自动更新):

https://github.com/pandas-dev/pandas/blob/6eb34f1badff4117a440f05ebcbb4292b91a1f23/web/pandas/index.html#L64 -L67

所以那里需要修复。

(我似乎还记得一些关于我们是否发现链接到 1.0.0 而不是 1.0.x 更相关的讨论,但无论如何现在文本和链接不一致)

它固定在 master 上: https :

我不知道如何处理 CSS 问题。 我在周五设置了https://pandas.pydata.org/pandas-docs/debug/来复制/docs并且它确实做到了:我看到混乱的格式有一段时间了。 现在访问显示它看起来不错,所以缓存 CSS 的内容已经过期。

@TomAugspurger那是文档(我们确实删除了顶部栏中的“Whatsnew”链接),但 AFAIU 是关于主页上的错误链接( /web/

啊,谢谢。 应该只链接到最新消息索引吗?

2020 年 6 月 1 日星期一上午 6:10 Joris Van den Bossche <
[email protected]> 写道:

@TomAugspurger https://github.com/TomAugspurger那是文档(其中
我们确实删除了顶部栏中的“Whatsnew”链接),但 AFAIU 是
关于主页上的错误链接 (/web/)


你收到这个是因为你被提到了。
直接回复本邮件,在GitHub上查看
https://github.com/pandas-dev/pandas/issues/33300#issuecomment-636791563
或取消订阅
https://github.com/notifications/unsubscribe-auth/AAKAOITYNVIWYMGP5OXZTDTRUOEDANCNFSM4MATQACQ
.

@aterrel我认为这可能会缓存在位于 pandas 的网络服务器和互联网之间的 cloudflare CDN 中。

$ http https://pandas.pydata.org/pandas-docs/debug/_static/css/index.css
HTTP/1.1 200 OK
Age: 123
CF-Cache-Status: HIT
CF-RAY: 59ca0e5778575c43-STL
Cache-Control: max-age=14400
Connection: keep-alive
Content-Encoding: gzip
Content-Type: text/css
Date: Mon, 01 Jun 2020 15:44:26 GMT
ETag: W/"5e724acc-156c"
Expect-CT: max-age=604800, report-uri="https://report-uri.cloudflare.com/cdn-cgi/beacon/expect-ct"
Last-Modified: Wed, 18 Mar 2020 16:22:36 GMT
Server: cloudflare
Set-Cookie: __cfduid=d1bde881be99bc9d3922b6701123103c61591026266; expires=Wed, 01-Jul-20 15:44:26 GMT; path=/; domain=.pydata.org; HttpOnly; SameSite=Lax
Transfer-Encoding: chunked
Vary: Accept-Encoding
cf-request-id: 0312274aa800005c43bab24200000001
...

是否允许我访问 cloudflare 以便我可以清除某些缓存? https://support.cloudflare.com/hc/en-us/articles/200169246-Purging-cached-resources-from-Cloudflare。

其实,坚持下去。 我也许可以指示 nginx 不使用 CF 的缓存。 不过,直到以后才有时间研究它。

我的想法是向 nginx 添加cache-control以告诉 cloudflare 不要缓存任何内容,但是如果负载过高,我不想意外关闭我们的网络服务器。 我没有什么好主意。

@aterrel我认为最好访问 Cloudflare 以手动清除缓存。 你能授予我访问权限吗,或者我们可以在某个时间同步让你这样做吗?

@TomAugspurger你不知道如何更改/doc符号链接? (直接链接到正确的版本,而不是通过稳定版。当然不确定这是否会解决它)

@TomAugspurger是的,创建一个 cloudflare 帐户并将您使用的电子邮件地址发送给我。

对于那些观看的人,邀请已发送。 如果我可以提供任何其他服务,请告诉我。

谢谢安迪。

可能已通过 cloudflare 控制台使用此清除列表修复。

https://pandas.pydata.org/docs/_static/css/getting_started.css
https://pandas.pydata.org/docs/_static/css/index.css
https://pandas.pydata.org/docs/_static/css/pandas.css
https://pandas.pydata.org/pandas-docs/stable/_static/css/getting_started.css
https://pandas.pydata.org/pandas-docs/stable/_static/css/index.css
https://pandas.pydata.org/pandas-docs/stable/_static/css/pandas.css
https://pandas.pydata.org/docs/_static/js/index.js
https://pandas.pydata.org/pandas-docs/stable/_static/js/index.js

@jorisvandenbossche你能想到的任何其他东西都应该被清除?

我认为这应该是所有 Pandas doc 特定的 js/css 文件

谢谢。

非常感谢@simonjayhawkins管理发布!

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

idanivanov picture idanivanov  ·  3评论

marcelnem picture marcelnem  ·  3评论

ericdf picture ericdf  ·  3评论

BDannowitz picture BDannowitz  ·  3评论

matthiasroder picture matthiasroder  ·  3评论