ちょっとした問題です。 agressive_dash_splits
つづりが間違っています。 aggressive_dash_splits
である必要があります。 または、 dash
hyphen
代わりにdash
を使用して、 AGGRESSIVE_HYPHEN_SPLIT
クラスメンバーとtokenizer.perl
両方と整合性をdash
こともできます。
http://www.nltk.org/api/nltk.tokenize.html#nltk.tokenize.moses.MosesTokenizer.tokenize
また、この機能はテストされていないようです。
迅速なPRをしてくれた@somnathrakshitに感謝します。 パラメータ名を変更するとAPIが破損するため、古いパラメータ名を使用する場合は、最初にDeprecationWarningをオプションとして提供してから、次のメジャーバージョンで完全に削除できるようにすることをお勧めします。 開発者ガイドラインやCONTRIBUTING.mdのドキュメントで明示的に言及されていないので、通常のNLTK開発者がここで手順についてコメントできるかもしれません。 @alvations 、関数/パラメータ名を変更するためのガイドラインや前例はありますか?
@goodmami @somnathrakshitこの場合、APIを壊す心配はありません。 ほとんどの人は、正しい引数ではなく、タイプミスの引数に悩まされるでしょう=)
非推奨とユーザースペースの破壊に関しては、この場合は私たちの責任であり、ユーザーが新しいNLTKバージョンに更新するのは簡単です。
しかし、他の場合、特に。 タイプミスだけでなく、より大きな変更に関しては、非推奨のスタンフォードツールhttps://github.com/nltk/nltk/blob/develop/nltk/tagで行ったようにwarnings
使用できます。 /stanford.py#L51
お知らせいただきありがとうございます@alvations 。 オープンソースの初心者として、nltkはいじくり回してきました。 GSoC 2018に参加していますか?
#1956で解決
@somnathrakshit貢献してくれてありがとう! 残念ながら、私たちはGSoC 2018に参加していません。おそらく、ボランティアが増えるもう1年です=)