只是一个小问题。 agressive_dash_splits
拼写错误。 应该是aggressive_dash_splits
。 或者也许使用hyphen
而不是dash
来与AGGRESSIVE_HYPHEN_SPLIT
类成员和tokenizer.perl
。
http://www.nltk.org/api/nltk.tokenize.html#nltk.tokenize.moses.MosesTokenizer.tokenize
同样,此功能似乎未经过测试。
感谢@somnathrakshit的快速公关。 请注意,更改参数名称会破坏API,因此最好在使用旧参数名称时将其作为选项提供给DeprecationWarning,然后在下一个主要版本中将其完全删除。 也许常规的NLTK开发人员可以在此处对此过程发表评论,因为在开发人员指南或CONTRIBUTING.md文档中我没有明确提及该过程。 @alvations ,是否有任何准则或先例可以更改功能/参数名称?
@goodmami @somnathrakshit在这种情况下,无需担心会破坏API。 大多数人会受到错字参数的困扰,而不是正确的参数=)
关于弃用和破坏用户空间,在这种情况下,这是我们的错,并且用户更容易更新到新的NLTK版本。
但在其他情况下,尤其是。 当涉及到更多主要变化而不仅仅是错字时,我们可以像淘汰斯坦福工具一样使用warnings
https://github.com/nltk/nltk/blob/develop/nltk/tag /stanford.py#L51
感谢@alvations让我们知道。 作为开放源代码的初学者,nltk非常适合修改。 您是否正在参加GSoC 2018?
在#1956中解决
@somnathrakshit感谢您的贡献! 不幸的是,我们没有参加GSoC2018。也许还有一年,当我们有更多志愿者时=)