Juste un problème mineur. Le agressive_dash_splits
est mal orthographié. Cela devrait être aggressive_dash_splits
. Ou peut-être utiliser hyphen
au lieu de dash
pour être cohérent avec le membre de classe AGGRESSIVE_HYPHEN_SPLIT
et avec tokenizer.perl
.
http://www.nltk.org/api/nltk.tokenize.html#nltk.tokenize.moses.MosesTokenizer.tokenize
Cette fonctionnalité ne semble pas non plus testée.
Merci @somnathrakshit pour le PR rapide. Notez que la modification du nom du paramètre casse l'API, il peut donc être préférable de la fournir d'abord en option avec un DeprecationWarning lorsque l'ancien nom de paramètre est utilisé, puis il peut être entièrement supprimé à la prochaine version majeure. Peut-être qu'un développeur NLTK ordinaire peut commenter la procédure ici, car je ne l'ai pas vu explicitement mentionné dans les instructions pour les développeurs ou dans le document CONTRIBUTING.md. @alvations , existe-t-il des directives ou des précédents pour changer les noms de fonction / paramètre?
@goodmami @somnathrakshit ne
En ce qui concerne la dépréciation et la rupture de l'espace utilisateur, dans ce cas, c'est notre faute et il est plus facile pour les utilisateurs de mettre à jour vers la nouvelle version de NLTK.
Mais dans d'autres cas, esp. quand il s'agit de changements plus importants qui ne sont pas qu'une faute de frappe, nous pouvons utiliser warnings
comme ce que nous avons fait avec les outils de Stanford obsolètes https://github.com/nltk/nltk/blob/develop/nltk/tag /stanford.py#L51
Merci @alvations de nous l'avoir fait savoir. En tant que débutant en open source, nltk a été agréable à bricoler. Participez-vous au GSoC 2018?
Résolu en # 1956
@somnathrakshit Merci pour la contribution! Malheureusement, nous ne participons pas au GSoC 2018. Peut-être une autre année où nous aurons plus de bénévoles =)