Nltk: كيفية تنزيل حزمة corpus panlex_lite في nltk في لغة python

تم إنشاؤها على ١٧ يناير ٢٠١٦  ·  30تعليقات  ·  مصدر: nltk/nltk

يمكنني تحميل جميع الحزم ماعدا panlex_lite كيف يمكنني تنزيله؟

التعليق الأكثر فائدة

استخدم عنوان url هذا [http://dev.panlex.org/db/panlex_lite.zip] لتنزيله يدويًا.

ال 30 كومينتر

جرب داخل بايثون:

>>> import nltk
>>> nltk.download('panlex_lite')

أو على سطر الأوامر:

$ python -m nltk.downloader panlex_lite

ملاحظة: قد يستغرق تنزيل البيانات بعض الوقت.

لاحظ أنك تحتاج إلى تثبيت إصدار التطوير من NLTK للقيام بذلك.

استخدم عنوان url هذا [http://dev.panlex.org/db/panlex_lite.zip] لتنزيله يدويًا.

انتظر NLTK v3.2 ويرجى الاطلاع على مناقشة مكثفة على https://github.com/nltk/nltk/issues/1283

مرحبًا بمجرد تنزيل panlex_lite يدويًا ، أين يجب أن أضعه في nltk_data؟
شكرا

يرجى مراجعة http://www.nltk.org/data.html

corpora ، المسار الكامل الخاص بي هو /usr/local/share/nltk_data/corpora

------------------ إبداعي ------------------
من: "Racekiller" [email protected] ؛
التاريخ: السبت ، 21 مايو 2016 ، الساعة 08:53 مساءً
إلى: "nltk / nltk" [email protected]؛
نسخة إلى: "肖宗阳" [email protected] ؛ "تعليق" [email protected] ؛
الموضوع: Re: [nltk / nltk] كيفية تنزيل حزمة corpus panlex_lite في nltk inpython (# 1253)

مرحبًا بمجرد تنزيل panlex_lite يدويًا ، أين يجب أن أضعه في nltk_data؟
شكرا

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub

أهلا،
هل لدى أي شخص فكرة عن سبب بطء تنزيله؟ في نهايتي عرضه 20 ساعة. تم تنزيل باقي الحزم.

deepp أقوم بتحميل هذا الملف المضغوط إلى سحابة بايدو. فيما يلي الرابط وكلمة المرور
الرابط: https://pan.baidu.com/s/1kVavU7d كلمة المرور: 7b5n

XiaoZYang شكرًا على الرد ، لقد قمت بتنزيل الملف يدويًا من رابط ردك السابق. شكرا جزيلا

تضمين التغريدة كن سعيدا لمساعدتك

يمكنك تنزيل ملف panlex_lite.zip من https://dev.panlex.org/db/ ووضعه في "/ nltk_data / corpora /"

أثناء تنزيل panlex باستخدام أداة تنزيل nltk ، تجمد نظامي بالكامل - حتى ضوء مؤشر caps lock على لوحة المفاتيح لم يعد يعمل. لقد قمت بإعادة تشغيل جهاز الكمبيوتر الخاص بي ، وحاولت مرة أخرى وحدث نفس الشيء.
هل يوجد ملف سجل في أي مكان لتزويدك بمزيد من المعلومات حول هذا؟
لمعلوماتك: أقوم بتشغيل idle3 / nltk3 / python 3.5.2 على KDE Neon على جهاز AMD64.

سأقوم فقط بتنزيل الملف المضغوط يدويًا.

ماذا تفعل بعد تنزيل ملف zip الخاص بـ panlex_lite بحيث يتم تنزيل حزم الباقي عند تقديم nltk.download ("all")؟ بحيث يتخطى تنزيل panlex_lite؟ قمت بفك ضغط المجلد المضغوط ولكن عندما أحاول تنزيل حزم الباقي يظهر تنزيل panlex_lite ... الرجاء المساعدة.

eupherntech نفس المشكلة.

انا ايضا اواجه نفس المشكلة.

راجع للشغل ، يتم تنزيل بيانات panlex_lite يدويًا.

eupherntechstevealbertwong هل يمكن استخدام nltk.download('all', halt_on_error=False) ، وذلك بعد فشلها في تحميل الحزمة، سوف يطلب منك إذا كنت ترغب في إعادة المحاولة لتحميل البرنامج. اضغط على n وسيتم تنزيل باقي الحزم.

نفس المشكلة هنا ، حتى يدويًا يستغرق الأمر ما يصل إلى 8 ساعات. افعل شيئا حيال ذلك من فضلك!

بناءً على الملف المذكور أعلاه ، يبدو أنه ملف 2.2 جيجابايت. لذلك قد تحتاج فقط إلى الانتظار والانتظار!

شيء واحد يمكنك القيام به في هذه الأثناء للحصول على مزيد من المعلومات هو إلقاء نظرة على الملف وآخر وقت تم تعديله لملف panlex_lite.zip في nltk_data / corpora / مثل ذلك:

$ ls -lh nltk_data/corpora/ | grep panlex_lite
-rw-r--r--     1 username  1607558449   2.1G Mar  4 10:51 panlex_lite.zip

لدي نفس المشكلة. لقد تم تنزيل panlex_lite بنجاح (من http://dev.panlex.org/db/panlex_lite.zip) وموجود في الدليل الصحيح ، ولكن عندما يتم استدعاء nltk.download () ، يحاول تنزيله مرة أخرى. هل هناك بعض الملفات الأخرى التي تحتاج إلى تحديث لإظهار أن المجموعة موجودة؟

يرجى الملاحظة: سأحاول اقتراحcimarie ، لكن المشكلة هي أنني أحاول استخدام السم لاختبار فرع قبل إرسال طلب سحب ، واستدعاء سموم nltk. تنزيل داخليًا ، لذلك لا أعتقد أن لدي القدرة على تضمين تلك الخيارات.

لقد قمت بتحديث المجاميع الاختبارية ، لذا يرجى المحاولة مرة أخرى

stevenbird الذي اختباري؟

على أي حال ، لا يبدو أنها نجحت. لا يزال nltk.download ('all') يحاول تنزيل panlex light ، على الرغم من أنني وضعت الملف المرفق بالرابط أعلاه في مجلد ~ / nltk_data / corpora.

وتجدر الإشارة أيضًا إلى أن أداة التنزيل تحاول تنزيل panlex_swadesh في كل مرة (على الرغم من أن هذا التنزيل أقصر بكثير من panlex_lite). لقد لاحظت وجود ملف panlex_swadesh.zip في مجلد corpora ، ومحاولة فك ضغطه يدويًا يعطي

Arthurs-MacBook- Pro: corpora aetilley $ unzip panlex_swadesh.zip
الأرشيف: panlex_swadesh.zip
لم يتم العثور على توقيع نهاية الدليل المركزي. إما أن هذا الملف ليس كذلك
ملف مضغوط ، أو يشكل قرصًا واحدًا من أرشيف متعدد الأجزاء. في ال
الحالة الأخيرة سيتم العثور على الدليل المركزي وتعليق zipfile في
القرص (الأقراص) الأخير من هذا الأرشيف.
unzip: لا يمكن العثور على دليل zipfile في ملف panlex_swadesh.zip أو
panlex_swadesh.zip.zip ، ولا يمكن العثور على نقطة panlex_swadesh.zip.ZIP.

aetilley - هذه الصفحة - قد تحتاج إلى "عرض المصدر".

هم من هذا الملف: https://dev.panlex.org/db/panlex_lite-20170401.zip

للأسف ليس لدي النطاق الترددي لتنزيله.

هناك شيئان يمكنك تجربتهما. ربما تكون قد قمت بالأولى للتو ، وفي هذه الحالة قد تكون الثانية تستحق التصوير.

  1. sudo python -m nltk.downloader panlex_lite
  2. القرص المضغوط PATH_TO_NLTK_DATA ؛ wget https://dev.panlex.org/db/panlex_lite-20170401.zip ؛ قم بفك ضغط panlex_lite-20170401.zip

تضمين التغريدة

أخشى أنه بعد تشغيل كلاهما (كلاهما بنجاح) ، لا يزال nltk.download ("الكل") غير قادر على رؤية panlex_lite.

مرة أخرى ، المشكلة الرئيسية هنا هي أنه يجعل من الصعب استخدام السموم.

فهل أنا الوحيد الذي يعاني من هذه المشكلة؟

هل nltk.download('all') هو السبب الرئيسي لهذه المشاكل؟ إذا كان الأمر كذلك ، فأعتقد أن nltk / nltk_data # 69 سيكون شيئًا يجب مراعاته.

بخلاف ذلك ، يكون الحل البديل مثل:

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('all')

alvations

وبشكل أكثر تحديدًا ، يتخطى nltk.download ("all") بشكل صحيح جميع المجموعات الأخرى التي أمتلكها بالفعل ، ولكن لسبب ما يحاول الحصول على panlex_lite في كل مرة.

أيضًا ، تستدعي Tox nltk.download ("all") ، لذلك من الصعب اختبارها محليًا قبل إجراء طلب سحب.

نأمل أن يحل nltk / nltk_data # 75 بعض المشكلات. وبعد دمج ذلك ، يجب أن يكون المستخدمون قادرين على تنفيذ nltk.download('all-nltk') بدلاً من nltk.download('all') إذا كانوا لا يريدون الانتظار لتنزيل الملف الكبير panlex_lite .

alvations

وماذا سوف تسمي توكس؟

مرة أخرى ، يسعدني تنزيل ملف كبير مرة واحدة ولكن يبدو أن برنامج التنزيل لا يرى أنني أملكه بالفعل ، لذا فهو يحاول تنزيله في كل مرة.

ومرة أخرى ، إذا كنت أنا الشخص الوحيد الذي يعاني من هذه المشكلة ، فربما لا تكون هذه مشكلة ، لكنني في حيرة من أمري.

aetilley : هل ما زال هذا يحدث؟ أعتقد أنه يجب إصلاحه الآن بعد أن أسقطنا panlex-lite من مجموعة NLTK corpus.

stevenbird ، alvations

نعم ، يبدو أن السم يعمل معي الآن. آسف ، لم أفهم أنك قد أصلحت ذلك.

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات