Hanya masalah kecil. agressive_dash_splits
salah eja. Seharusnya aggressive_dash_splits
. Atau mungkin gunakan hyphen
daripada dash
agar konsisten dengan anggota kelas AGGRESSIVE_HYPHEN_SPLIT
dan dengan tokenizer.perl
.
http://www.nltk.org/api/nltk.tokenize.html#nltk.tokenize.moses.MosesTokenizer.tokenize
Selain itu, fungsionalitas ini tampaknya tidak diuji.
Terima kasih @somnathrakshit untuk PR cepatnya. Perhatikan bahwa mengubah nama parameter akan merusak API, jadi mungkin lebih baik untuk menyediakannya terlebih dahulu sebagai opsi dengan DeprecationWarning saat nama parameter lama digunakan, kemudian dapat dihapus sepenuhnya di versi mayor berikutnya. Mungkin pengembang NLTK biasa dapat mengomentari prosedur di sini, karena saya tidak melihatnya disebutkan secara eksplisit dalam pedoman pengembang atau dokumen CONTRIBUTING.md. @alvations , apakah ada pedoman atau preseden untuk mengubah nama fungsi / parameter?
@goodmami @somnathrakshit jangan khawatir tentang melanggar API dalam kasus ini. Kebanyakan orang akan lebih terhalang oleh argumen kesalahan ketik daripada yang benar =)
Mengenai penghentian dan pemutusan ruang pengguna, dalam hal ini adalah kesalahan kami dan lebih mudah bagi pengguna untuk memperbarui ke versi NLTK yang baru.
Tetapi dalam kasus lain, khususnya. ketika sampai pada perubahan besar lainnya yang bukan hanya salah ketik, kami akan menggunakan warnings
seperti yang kami lakukan dengan menghentikan alat Stanford https://github.com/nltk/nltk/blob/develop/nltk/tag /stanford.py#L51
Terima kasih @alvations telah memberi tahu kami. Sebagai pemula dalam open source, nltk sangat menyenangkan untuk diotak-atik. Apakah Anda mengikuti GSoC 2018?
Diselesaikan di # 1956
@somnathrakshit Terima kasih atas kontribusinya! Sayangnya, kami tidak mengikuti GSoC 2018. Mungkin satu tahun lagi ketika kami memiliki lebih banyak relawan =)