Las versiones recientes de Python vienen con pip de forma predeterminada, por lo que las instrucciones de instalación en http://www.nltk.org/install.html no están actualizadas.
Para instalaciones modernas (independientemente del sistema operativo), los siguientes dos pasos deberían ser suficientes:
pip install nltk
python
luego escriba import nltk
La sugerencia de instalar opcionalmente NumPy debe tenerse en cuenta al señalar que requiere un sistema de compilación que funcione y, en cambio, los usuarios pueden preferir consultar las recomendaciones para instalar la pila completa de SciPy: http://scipy.org/install.html
Los usuarios de versiones anteriores de Python sin pip ya instalado probablemente se beneficiarán más consultando las propias instrucciones de instalación de pip en https://pip.pypa.io/en/latest/installing.html
Para obtener información sobre el origen de esta solicitud, tuvimos un nuevo usuario de Python que llegó a distutils-sig confundido por el baile de arranque de setuptools/pip: https://mail.python.org/pipermail/distutils-sig/2015-May/026486 .html
Ese baile _es_ confuso, por lo que comenzamos a proporcionar pip de forma predeterminada.
Hola @ncoghlan ,
Aquí está mi intento anterior de escribir documentos de instalación y la discusión relacionada: https://github.com/nltk/nltk/pull/697. ¿Podrías revisarlo y pesarlo? Su experiencia con lo que funciona y lo que no sería muy útil.
Creo que es una buena idea comenzar con las instrucciones simples "si ya tiene Python y pip instalados y configurados, simplemente ejecute las instrucciones 'pip install --user nltk'", como si eso funcionara, el usuario puede simplemente ejecutarlo y moverse sobre. Si _supone_ que es necesario instruirlos sobre cómo instalar Python, existe el riesgo de que coloquen NLTK en la canasta de "demasiado difícil" y se pierdan el hecho de que solo estaba a un comando de distancia.
Entonces vale la pena preguntarse "¿Cómo pueden fallar esas simples instrucciones?". Los tres casos principales:
Finalmente, para un uso más avanzado (como aprender a usar entornos virtuales), puede dirigirlos a https://packaging.python.org/en/latest/ y https://packaging.python.org/en/latest/ ciencia.html
La clave es centrarse en "¿Cómo puedo llevar a un usuario al punto de usar NLTK de manera productiva en la menor cantidad de pasos posibles?", en lugar de tratar de enseñarles habilidades extrañas (como el uso de entornos virtuales) que probablemente sean útiles. para ellos a largo plazo, pero inicialmente son solo una distracción de la tarea de ponerse en marcha por primera vez. ("Esto te será útil más adelante, créeme" casi nunca atrae la atención de un estudiante en persona, y es aún menos efectivo cuando se usa como parte de un proceso de aprendizaje autodirigido)
Los principios en la propuesta de @ncoghlan de:
ambos me parecen perfectos.
Gracias @ncoghlan , @kmike. He simplificado ligeramente las instrucciones (ver http://www.nltk.org/install.html). Antes de hacer más, quería verificar la mejor versión del comando pip. Hay tres sobre la mesa:
pip install nltk
sudo pip install nltk
pip install --user nltk
Todo esto supone que pip está instalado en la ruta de los usuarios. ¿Qué opción o explicación de opciones es probable que sea la más general?
Probablemente sea mejor ir con:
pip install nltk
Actualmente hay casos en los que eso no funcionará (específicamente instalaciones de sistema Python en Linux), pero ese es un problema conocido con el comportamiento predeterminado de pip: https://github.com/pypa/pip/issues/1668
Potencialmente, vale la pena sugerir "pip install --user nltk" como alternativa si la instalación inicial falla con un error de permisos.
▶ pip install ntlk
Collecting ntlk
Could not find a version that satisfies the requirement ntlk (from versions: )
No matching distribution found for ntlk
¿Es este el comportamiento esperado en este punto?
¿Debería estar compilando desde git?
@txtsd hay un error tipográfico en su comando de instalación, ya que tiene ntlk
lugar de nltk
(y pip/pypi actualmente no implementan sugerencias de errores tipográficos)
@ncoghlan Bueno, eso es vergonzoso. ¡Gracias!
Recientemente, scikit-learn
ha alejado a la gente de pip
y confía en el administrador de paquetes de la distribución o en conda
: http://scikit-learn.org/stable/install.html.
Posiblemente, agregar instrucciones de instalación de conda a http://www.nltk.org/install.html podría ahorrarle tiempo a los usuarios, por ejemplo, http://nlpworkgroup.postach.io/post/install-miniconda-python-for-nltk- on-windows , especialmente para usuarios de windows.
@alvations buen punto con respecto a conda
. Es probablemente la forma más robusta de obtener un entorno de python científico que funcione.
Coleccionando nlkt
No se pudo encontrar una versión que satisfaga el requisito nlkt (de las versiones:)
No se encontró una distribución coincidente para nlkt
Estoy experimentando este problema. Intento instalar nlkt.
Por favor, ayúdame a intentar resolverlo. Estoy usando Ubuntu 17.04.
@kafomambia Hay un error tipográfico en su comando de instalación: las dos últimas letras están invertidas actualmente. Desea nltk
(para Natural Language ToolKit) en lugar de su nlkt
actual.
Coleccionando nltk
Reintentando (Reintentar(total=4, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError('
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=3, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError('
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=2, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError('
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=1, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError('
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
Reintentando (Reintentar(total=0, conectar=Ninguno, leer=Ninguno, redirigir=Ninguno)) después de conectar
ción rota por 'NewConnectionError('
una nueva conexión: [Errno 11002] getaddrinfo falló',)': /simple/nltk/
No se pudo encontrar una versión que satisfaga el requisito nltk (de las versiones:)
No se encontró una distribución coincidente para nltk
Recibo el error anterior mientras trato de instalar nltk (python 3.5.2)
Comentario más útil
@txtsd hay un error tipográfico en su comando de instalación, ya que tiene
ntlk
lugar denltk
(y pip/pypi actualmente no implementan sugerencias de errores tipográficos)