مجرد مسألة بسيطة. خطأ إملائي في agressive_dash_splits
. يجب أن يكون aggressive_dash_splits
. أو ربما تستخدم hyphen
بدلاً من dash
لتتوافق مع كل من عضو فئة AGGRESSIVE_HYPHEN_SPLIT
ومع tokenizer.perl
.
http://www.nltk.org/api/nltk.tokenize.html#nltk.tokenize.moses.MosesTokenizer.tokenize
كما يبدو أن هذه الوظيفة لا يتم اختبارها.
شكرًا somnathrakshit على العلاقات العامة السريعة. لاحظ أن تغيير اسم المعلمة يكسر واجهة برمجة التطبيقات ، لذلك قد يكون من الأفضل توفيرها أولاً كخيار مع تحذير الإيقاف عند استخدام اسم المعلمة القديم ، ثم يمكن إزالته بالكامل في الإصدار الرئيسي التالي. ربما يمكن لمطور NLTK العادي التعليق على الإجراء هنا ، لأنني لم أره مذكورًا صراحةً في إرشادات المطور أو CONTRIBUTING.md doc. alvations ، هل هناك أي إرشادات أو سوابق لتغيير أسماء الوظائف / المعلمات؟
somnathrakshitgoodmami لا تقلق حول كسر API في هذه الحالة. سيكون معظم الناس أكثر إحباطًا بسبب حجة الخطأ المطبعي بدلاً من الوسيطة الصحيحة =)
فيما يتعلق بالإهمال وكسر مساحة المستخدم ، في هذه الحالة يكون خطأنا ويسهل على المستخدمين التحديث إلى إصدار NLTK الجديد.
ولكن في حالات أخرى ، خاصة. عندما يتعلق الأمر بالمزيد من التغييرات الرئيسية التي ليست مجرد خطأ إملائي ، يمكننا استخدام warnings
مثل ما فعلناه مع إهمال أدوات ستانفورد https://github.com/nltk/nltk/blob/develop/nltk/tag /stanford.py#L51
شكرًا alvations لإعلامنا بذلك. كمبتدئ في المصادر المفتوحة ، كان nltk لطيفًا للعبث به. هل أنت مشارك في GSoC 2018؟
صدر القرار فى رقم 1956
somnathrakshit شكرا على المساهمة! للأسف ، نحن لا نشارك في GSoC 2018. ربما سنة أخرى عندما يكون لدينا المزيد من المتطوعين =)