Nltk: MosesTokenizer的函数参数拼写错误:agressive_dash_splits

创建于 2018-02-14  ·  4评论  ·  资料来源: nltk/nltk

只是一个小问题。 agressive_dash_splits拼写错误。 应该是aggressive_dash_splits 。 或者也许使用hyphen而不是dash来与AGGRESSIVE_HYPHEN_SPLIT类成员和tokenizer.perl

http://www.nltk.org/api/nltk.tokenize.html#nltk.tokenize.moses.MosesTokenizer.tokenize

同样,此功能似乎未经过测试。

bug documentation resolved tokenizer

所有4条评论

感谢@somnathrakshit的快速公关。 请注意,更改参数名称会破坏API,因此最好在使用旧参数名称时将其作为选项提供给DeprecationWarning,然后在下一个主要版本中将其完全删除。 也许常规的NLTK开发人员可以在此处对此过程发表评论,因为在开发人员指南或CONTRIBUTING.md文档中我没有明确提及该过程。 @alvations ,是否有任何准则或先例可以更改功能/参数名称?

@goodmami @somnathrakshit在这种情况下,无需担心会破坏API。 大多数人会受到错字参数的困扰,而不是正确的参数=)

关于弃用和破坏用户空间,在这种情况下,这是我们的错,并且用户更容易更新到新的NLTK版本。

但在其他情况下,尤其是。 当涉及到更多主要变化而不仅仅是错字时,我们可以像淘汰斯坦福工具一样使用warnings https://github.com/nltk/nltk/blob/develop/nltk/tag /stanford.py#L51

感谢@alvations让我们知道。 作为开放源代码的初学者,nltk非常适合修改。 您是否正在参加GSoC 2018?

在#1956中解决

@somnathrakshit感谢您的贡献! 不幸的是,我们没有参加GSoC2018。也许还有一年,当我们有更多志愿者时=)

此页面是否有帮助?
0 / 5 - 0 等级