Nltk: وظيفة للوصول إلى كائن Synset باستخدام مفتاح الاستشعار

تم إنشاؤها على ١٠ يناير ٢٠١٨  ·  4تعليقات  ·  مصدر: nltk/nltk

ربما فاتني ذلك ولكن هل هناك وظيفة للوصول إلى الكائن Synset من واجهة NLTK wordnet من مفتاح الإحساس ؟

إذا لم يكن هناك ، هل يمكننا الكشف عن وظيفة يمكنها تحقيق ذلك في nltk.corpus.wordnet ؟ على سبيل المثال https://stackoverflow.com/questions/48170666/how-to-get-the-gloss-given-sense-key-using-nltk-wordnet/

من الناحية المثالية ، سيكون من الجيد أن يكون لديك وظائف للوصول إلى كائنات Synset باستخدام:

  1. offset-pos ، على سبيل المثال 1433493-a -> Synset('long.a.02')
  2. sense_key ، على سبيل المثال long%3:00:02:: -> Synset('long.a.02')

حاليًا ، لدينا synset_from_pos_and_offset() لـ (1).

هناك وظيفة أخرى ( _synset_from_pos_and_line ) تقرأ السطر التالي لإرجاع Synset('long.a.02') :

01433493 00 a 01 long 1 016 = 05129201 n 0000 + 05133287 n 0101 ! 01436003 a 0101 & 01434007 a 0000 & 01434218 a 0000 & 01434530 a 0000 & 01434717 a 0000 & 01434841 a 0000 & 01434966 a 0000 & 01435060 a 0000 & 01435189 a 0000 & 01435290 a 0000 & 01435399 a 0000 & 01435507 a 0000 & 01435675 a 0000 & 01435891 a 0000 | primarily spatial sense; of relatively great or greater than average spatial extension or extension as specified; "a long road"; "a long distance"; "contained many long words"; "ten miles long" 

لكنه ليس مفتاح الإحساس.

corpus enhancement goodfirstbug nice idea wordnet

التعليق الأكثر فائدة

تم تنفيذ الوظيفة المقترحة في تدفق المكدس ، ولكن لا يبدو أنها تعين الحواس الصحيحة - على سبيل المثال ، أعاد afraid.a.04 synset_from_sense_key('afraid%3:00:00::') afraid.a.04 بدلاً من afraid.a.01 . تمتد هذه المشكلة إلى نقاط البيع الأخرى أيضًا. (تم الحصول على مفاتيح الاستشعار من واجهة Wordnet عبر الإنترنت )

بدلاً من ذلك ، يبدو أن استخدام الطريقة الموضحة في وثائق SemCor للتعيين بشكل صحيح - توجد حاليًا وظيفة lemma_from_key(key) يبدو أنها تأخذ شيئًا مشابهًا لمفتاح الإحساس. ومع ذلك ، لا يدعم lemma_from key(key) الأقمار الصناعية الصفية (مثل afraid%3:00:02:concerned:00 ). يمكنني بالتأكيد تنفيذ غلاف حول lemma_from_key(key) لإصلاح ذلك وإرجاع Synset .

ال 4 كومينتر

أود العمل على هذا!

craaaa آسف على الرد المتأخر ، كان بعيدًا لفترة من الوقت.

لا تتردد في العمل عليه وإنشاء علاقات عامة بعد ذلك.
P / S: لا تقلق بشأن كسر أي شيء ، فستكون هناك عمليات تحقق ومراجعات قبل دمج الكود.

تم تنفيذ الوظيفة المقترحة في تدفق المكدس ، ولكن لا يبدو أنها تعين الحواس الصحيحة - على سبيل المثال ، أعاد afraid.a.04 synset_from_sense_key('afraid%3:00:00::') afraid.a.04 بدلاً من afraid.a.01 . تمتد هذه المشكلة إلى نقاط البيع الأخرى أيضًا. (تم الحصول على مفاتيح الاستشعار من واجهة Wordnet عبر الإنترنت )

بدلاً من ذلك ، يبدو أن استخدام الطريقة الموضحة في وثائق SemCor للتعيين بشكل صحيح - توجد حاليًا وظيفة lemma_from_key(key) يبدو أنها تأخذ شيئًا مشابهًا لمفتاح الإحساس. ومع ذلك ، لا يدعم lemma_from key(key) الأقمار الصناعية الصفية (مثل afraid%3:00:02:concerned:00 ). يمكنني بالتأكيد تنفيذ غلاف حول lemma_from_key(key) لإصلاح ذلك وإرجاع Synset .

تضمين التغريدة أعتقد أنه لا تزال هناك مشكلة مع الأقمار الصناعية الصفية. حاولت استخدام وظيفة synset_from_sense_key وهنا الخطأ:

ملف "/home/izorar/anaconda3/lib/python3.7/site-packages/nltk/corpus/reader/wordnet.py" ، السطر 1356 ، في المزامنة ، رفع WordNetError (message٪ lemma) WordNetError: مطلوب قمر صناعي صفة ولكن عادي فقط تم العثور على صفة لـ lemma "أولاً"

أي فكرة عن كيفية إصلاح الخطأ؟

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات