Nltk: Actualice las instrucciones de instalación para versiones recientes de Python

Creado en 30 may. 2015  ·  14Comentarios  ·  Fuente: nltk/nltk

Las versiones recientes de Python vienen con pip de forma predeterminada, por lo que las instrucciones de instalación en http://www.nltk.org/install.html no están actualizadas.

Para instalaciones modernas (independientemente del sistema operativo), los siguientes dos pasos deberían ser suficientes:

  1. Instalar NLTK: pip install nltk
  2. Instalación de prueba: ejecute python luego escriba import nltk

La sugerencia de instalar opcionalmente NumPy debe tenerse en cuenta al señalar que requiere un sistema de compilación que funcione y, en cambio, los usuarios pueden preferir consultar las recomendaciones para instalar la pila completa de SciPy: http://scipy.org/install.html

Los usuarios de versiones anteriores de Python sin pip ya instalado probablemente se beneficiarán más consultando las propias instrucciones de instalación de pip en https://pip.pypa.io/en/latest/installing.html

documentation inactive

Comentario más útil

@txtsd hay un error tipográfico en su comando de instalación, ya que tiene ntlk lugar de nltk (y pip/pypi actualmente no implementan sugerencias de errores tipográficos)

Todos 14 comentarios

Para obtener información sobre el origen de esta solicitud, tuvimos un nuevo usuario de Python que llegó a distutils-sig confundido por el baile de arranque de setuptools/pip: https://mail.python.org/pipermail/distutils-sig/2015-May/026486 .html

Ese baile _es_ confuso, por lo que comenzamos a proporcionar pip de forma predeterminada.

Hola @ncoghlan ,

Aquí está mi intento anterior de escribir documentos de instalación y la discusión relacionada: https://github.com/nltk/nltk/pull/697. ¿Podrías revisarlo y pesarlo? Su experiencia con lo que funciona y lo que no sería muy útil.

Creo que es una buena idea comenzar con las instrucciones simples "si ya tiene Python y pip instalados y configurados, simplemente ejecute las instrucciones 'pip install --user nltk'", como si eso funcionara, el usuario puede simplemente ejecutarlo y moverse sobre. Si _supone_ que es necesario instruirlos sobre cómo instalar Python, existe el riesgo de que coloquen NLTK en la canasta de "demasiado difícil" y se pierdan el hecho de que solo estaba a un comando de distancia.

Entonces vale la pena preguntarse "¿Cómo pueden fallar esas simples instrucciones?". Los tres casos principales:

  1. Todavía no tienen Python en absoluto. En esos casos, sugiero aplazar las instrucciones de la pila SciPy, ya que eso les dará a los usuarios afectados un NLTK acelerado por NumPy: http://scipy.org/install.html
  2. Tienen Python, pero no pip. En esos casos, sugiero ceder a las propias instrucciones de arranque de pip: https://pip.pypa.io/en/latest/installing.html
  3. Tienen Python y pip, pero hay algo más que impide que funcione el enfoque "pip install --user nltk" (por ejemplo, están usando una instalación del sistema Python 3 en Linux, donde "pip" se instala en la pila de Python 2, y usted necesita usar "pip3" o "python3 -m pip" para instalar en la versión correcta). Para este caso, sugiero recomendar que prueben "python -m pip install --user nltk", y si eso aún no funciona, apúntelos en https://docs.python.org/3/installing/ para obtener más información. ideas para probar.

Finalmente, para un uso más avanzado (como aprender a usar entornos virtuales), puede dirigirlos a https://packaging.python.org/en/latest/ y https://packaging.python.org/en/latest/ ciencia.html

La clave es centrarse en "¿Cómo puedo llevar a un usuario al punto de usar NLTK de manera productiva en la menor cantidad de pasos posibles?", en lugar de tratar de enseñarles habilidades extrañas (como el uso de entornos virtuales) que probablemente sean útiles. para ellos a largo plazo, pero inicialmente son solo una distracción de la tarea de ponerse en marcha por primera vez. ("Esto te será útil más adelante, créeme" casi nunca atrae la atención de un estudiante en persona, y es aún menos efectivo cuando se usa como parte de un proceso de aprendizaje autodirigido)

Los principios en la propuesta de @ncoghlan de:

  • mantenerlo lo más simple posible, y
  • delegar a otras fuentes de información (autorizadas) siempre que sea posible

ambos me parecen perfectos.

Gracias @ncoghlan , @kmike. He simplificado ligeramente las instrucciones (ver http://www.nltk.org/install.html). Antes de hacer más, quería verificar la mejor versión del comando pip. Hay tres sobre la mesa:

pip install nltk
sudo pip install nltk
pip install --user nltk

Todo esto supone que pip está instalado en la ruta de los usuarios. ¿Qué opción o explicación de opciones es probable que sea la más general?

Probablemente sea mejor ir con:

pip install nltk

Actualmente hay casos en los que eso no funcionará (específicamente instalaciones de sistema Python en Linux), pero ese es un problema conocido con el comportamiento predeterminado de pip: https://github.com/pypa/pip/issues/1668

Potencialmente, vale la pena sugerir "pip install --user nltk" como alternativa si la instalación inicial falla con un error de permisos.

▶ pip install ntlk
Collecting ntlk
  Could not find a version that satisfies the requirement ntlk (from versions: )
No matching distribution found for ntlk

¿Es este el comportamiento esperado en este punto?
¿Debería estar compilando desde git?

@txtsd hay un error tipográfico en su comando de instalación, ya que tiene ntlk lugar de nltk (y pip/pypi actualmente no implementan sugerencias de errores tipográficos)

@ncoghlan Bueno, eso es vergonzoso. ¡Gracias!

Recientemente, scikit-learn ha alejado a la gente de pip y confía en el administrador de paquetes de la distribución o en conda : http://scikit-learn.org/stable/install.html.

Posiblemente, agregar instrucciones de instalación de conda a http://www.nltk.org/install.html podría ahorrarle tiempo a los usuarios, por ejemplo, http://nlpworkgroup.postach.io/post/install-miniconda-python-for-nltk- on-windows , especialmente para usuarios de windows.

@alvations buen punto con respecto a conda . Es probablemente la forma más robusta de obtener un entorno de python científico que funcione.

Coleccionando nlkt
No se pudo encontrar una versión que satisfaga el requisito nlkt (de las versiones:)
No se encontró una distribución coincidente para nlkt

Estoy experimentando este problema. Intento instalar nlkt.
Por favor, ayúdame a intentar resolverlo. Estoy usando Ubuntu 17.04.

@kafomambia Hay un error tipográfico en su comando de instalación: las dos últimas letras están invertidas actualmente. Desea nltk (para Natural Language ToolKit) en lugar de su nlkt actual.

Coleccionando nltk
Reintentando (Reintentar(total=4, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError(' Objeto ction.VerifiedHTTPSConnection en 0x0000007AC2BB2748>: no se pudo establecer
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=3, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError(' Objeto ction.VerifiedHTTPSConnection en 0x0000007AC2BB2B38>: no se pudo establecer
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=2, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError(' Objeto ction.VerifiedHTTPSConnection en 0x0000007AC2BB2860>: no se pudo establecer
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=1, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError(' Objeto ction.VerifiedHTTPSConnection en 0x0000007AC2BB29E8>: no se pudo establecer
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=0, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError(' Objeto ction.VerifiedHTTPSConnection en 0x0000007AC2BB2898>: no se pudo establecer
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
No se pudo encontrar una versión que satisfaga el requisito nltk (de las versiones:)

No se encontró una distribución coincidente para nltk

Recibo el error anterior mientras trato de instalar nltk (python 3.5.2)

¿Fue útil esta página
0 / 5 - 0 calificaciones

Temas relacionados

alvations picture alvations  ·  4Comentarios

libingnan54321 picture libingnan54321  ·  3Comentarios

stevenbird picture stevenbird  ·  4Comentarios

DavidNemeskey picture DavidNemeskey  ·  4Comentarios

BLKSerene picture BLKSerene  ·  4Comentarios