Nltk: Problèmes d'API DependencyGraph ou Stanford Parser avec des phrases avec "/"

Créé le 18 nov. 2016 · 31Commentaires · Source: nltk/nltk

Un utilisateur a signalé que cette phrase lève et AssertionError lors de l'utilisation de l'API DependencyParser de Stanford en NLTK pour cette phrase:

pour tous ses aperçus sur le monde onirique de la vie adolescente et son expression électronique à travers la cyber-culture, le film ne donne pas de quart à quiconque cherche à tirer une histoire cohérente de ses 2 heures et demie.

Code:

>>> from nltk.parse.stanford import StanfordDependencyParser                                                                                       >>> dep_parser=StanfordDependencyParser(model_path="edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")                                        
>>> sent = 'for all of its insights into the dream world of teen life , and its electronic expression through cyber culture , the film gives no quarter to anyone seeking to pull a cohesive story out of its 2 1/2-hour running time . '
>>> dep_parser.raw_parse(sent)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Library/Python/2.7/site-packages/nltk/parse/stanford.py", line 132, in raw_parse
    return next(self.raw_parse_sents([sentence], verbose))
  File "/Library/Python/2.7/site-packages/nltk/parse/stanford.py", line 150, in raw_parse_sents
    return self._parse_trees_output(self._execute(cmd, '\n'.join(sentences), verbose))
  File "/Library/Python/2.7/site-packages/nltk/parse/stanford.py", line 91, in _parse_trees_output
    res.append(iter([self._make_tree('\n'.join(cur_lines))]))
  File "/Library/Python/2.7/site-packages/nltk/parse/stanford.py", line 339, in _make_tree
    return DependencyGraph(result, top_relation_label='root')
  File "/Library/Python/2.7/site-packages/nltk/parse/dependencygraph.py", line 84, in __init__
    top_relation_label=top_relation_label,
  File "/Library/Python/2.7/site-packages/nltk/parse/dependencygraph.py", line 328, in _parse
    assert cell_number == len(cells)
AssertionError

C'est peut-être la façon dont DependencyGraph lit la sortie ou que la sortie de Stanford est incohérente.

Plus de détails sur la configuration des outils NLTK + Stanford sont disponibles sur https://gist.github.com/alvations/e1df0ba227e542955a8a#stanford -parser

bug dependency parsing pleaseverify

Source

alvations

Commentaire le plus utile

@dimazest Le problème a été résolu. Merci pour votre aide et votre patience pendant tout ce temps!

tesslo le 13 juil. 2017

🎉1 👍1

Tous les 31 commentaires

Salut @alvations Des mises à jour à ce sujet?
Merci

hoavt-54 le 4 mai 2017

@ hoavt-54 Je pense qu'il existe un moyen rapide de vérifier si c'est du côté de Stanford ou du code DependencyGraph qui cause le problème en utilisant la nouvelle interface de # 1249. Je serai un peu occupé aujourd'hui mais peut-être que quelqu'un d'autre pourra le vérifier et revenir là-dessus.

alvations le 5 mai 2017

Je peux jeter un oeil, j'ai manqué ce problème.

dimazest le 24 mai 2017

👍1

@dimazest Bonjour, je viens de rencontrer cette erreur. Comment dois-je résoudre ce problème?

tesslo le 3 juin 2017

@tesslocl quelle est votre phrase? Avez-vous essayé d'utiliser CoreNLP (nltk / parse / corenlp.py) à la place?

dimazest le 3 juin 2017

@dimazest que je viens de faire et j'ai rencontré une autre erreur:

Traceback (most recent call last):
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py", line 386, in _make_request
    six.raise_from(e, None)
  File "<string>", line 2, in raise_from
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py", line 382, in _make_request
    httplib_response = conn.getresponse()
  File "C:\Users\Admin\Anaconda3\lib\http\client.py", line 1198, in getresponse
    response.begin()
  File "C:\Users\Admin\Anaconda3\lib\http\client.py", line 297, in begin
    version, status, reason = self._read_status()
  File "C:\Users\Admin\Anaconda3\lib\http\client.py", line 258, in _read_status
    line = str(self.fp.readline(_MAXLINE + 1), "iso-8859-1")
  File "C:\Users\Admin\Anaconda3\lib\socket.py", line 576, in readinto
    return self._sock.recv_into(b)
socket.timeout: timed out

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\adapters.py", line 423, in send
    timeout=timeout
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py", line 649, in urlopen
    _stacktrace=sys.exc_info()[2])
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\util\retry.py", line 347, in increment
    raise six.reraise(type(error), error, _stacktrace)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\packages\six.py", line 686, in reraise
    raise value
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py", line 600, in urlopen
    chunked=chunked)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py", line 388, in _make_request
    self._raise_timeout(err=e, url=url, timeout_value=read_timeout)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py", line 308, in _raise_timeout
    raise ReadTimeoutError(self, url, "Read timed out. (read timeout=%s)" % timeout_value)
requests.packages.urllib3.exceptions.ReadTimeoutError: HTTPConnectionPool(host='localhost', port=9000): Read timed out. (read timeout=60)

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "E:\classifier\feature_extraction.py", line 473, in <module>
    print(feature_extraction(test_file_id))
  File "E:\classifier\feature_extraction.py", line 146, in feature_extraction
    for line in dep_parse:
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 279, in raw_parse_sents
    parsed_data = self.api_call(sentence, properties=default_properties)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 247, in api_call
    timeout=60,
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\sessions.py", line 535, in post
    return self.request('POST', url, data=data, json=json, **kwargs)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\sessions.py", line 488, in request
    resp = self.send(prep, **send_kwargs)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\sessions.py", line 609, in send
    r = adapter.send(request, **kwargs)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\requests\adapters.py", line 499, in send
    raise ReadTimeout(e, request=request)
requests.exceptions.ReadTimeout: HTTPConnectionPool(host='localhost', port=9000): Read timed out. (read timeout=60)

J'ai seulement changé la partie StanfordDependencyParser et laissé le reste du code inchangé. J'ai vérifié la documentation et je suppose que les méthodes de CoreNLP sont les mêmes, ai-je raison? L'analyse semble réussir car l'erreur se trouve sur la ligne suivante où je boucle sur les résultats de l'analyse.

tesslo le 3 juin 2017

Vous devez démarrer un serveur cornlp, essayez:

with CoreNLPServer(port=9000) as server:
    parser = CoreNLPParser(url=server.url)
    parser.parse(...)

Je suis désolé pour la documentation manquante et pour une réponse de chemise, car je tape sur mon téléphone.

dimazest le 3 juin 2017

@dimazest J'apprécie vraiment votre aide et vos réponses rapides. Mais les erreurs restent :(

Traceback (most recent call last):
  File "E:\classifier\feature_extraction.py", line 474, in <module>
    print(feature_extraction(test_file_id))
  File "E:\classifier\feature_extraction.py", line 135, in feature_extraction
    with CoreNLPServer(port=9000) as server:
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 81, in __init__
    try_port(port)
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 35, in try_port
    sock.bind(('', port))
OSError: [WinError 10048] Only one usage of each socket address (protocol/network address/port) is normally permitted

J'ai essayé de googler mais je ne sais pas comment fonctionnent les sockets ...

tesslo le 3 juin 2017

vous pouvez essayer un autre port: CoreNLPServer (port = 9001), par exemple ou juste CoreNLPServer (), alors un port libre doit être choisi.

dimazest le 5 juin 2017

@dimazest J'ai essayé 9001 à 9010 et aussi des parenthèses vides et c'est ce que j'obtiens à chaque fois:

Traceback (most recent call last):
  File "E:\classifier\feature_extraction.py", line 509, in <module>
    print(feature_extraction(test_file_id))
  File "E:\classifier\feature_extraction.py", line 136, in feature_extraction
    with CoreNLPServer() as server:
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 170, in __enter__
    self.start()
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 149, in start
    'Could not connect to the server.'
nltk.parse.corenlp.CoreNLPServerError: Could not connect to the server.

Étant donné que je suis en Chine, j'ai gardé mon VPN allumé tout en l'exécutant, mais toujours pas de chance. Quel pourrait être mon problème ici?

tesslo le 7 juin 2017

Avez-vous corenlp .jars? Vous devez disposer d'un serveur corenlp fonctionnant localement.

Pouvez-vous exécuter cet exemple https://github.com/nltk/nltk/pull/1249#pullrequestreview -18096061

dimazest le 7 juin 2017

J'ai des fichiers jar dans le répertoire E:\classifier\stanford\stanford-corenlp-full-2016-10-31 et je suppose que ce sont ceux auxquels vous faites référence:

stanford-corenlp-3.7.0.jar
stanford-corenlp-3.7.0-javadoc.jar
stanford-corenlp-3.7.0-models.jar
stanford-corenlp-3.7.0-sources.jar

Et le répertoire a été défini sur la variable d'environnement CLASSPATH.

Je peux exécuter l'exemple dans l'invite de commande Windows et voici la sortie:

Python 3.5.3 |Anaconda custom (64-bit)| (default, Feb 22 2017, 21:28:42) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from nltk.parse.corenlp import *
>>> global server
>>> server = CoreNLPServer()
>>> server.start()
>>> parser = CoreNLPParser(url='http://localhost:9000')
>>> sent = 'the quick brown fox jumps over the lazy dog'
>>> parser.raw_parse(sent)
<list_iterator object at 0x000001F0EFED69E8>
>>> fox_parsed = next(parser.raw_parse(sent))
>>> fox_parsed.pretty_print()
                     ROOT
                      |
                      NP
       _______________|_________
      |                         NP
      |                _________|___
      |               |             PP
      |               |     ________|___
      NP              NP   |            NP
  ____|__________     |    |     _______|____
 DT   JJ    JJ   NN  NNS   IN   DT      JJ   NN
 |    |     |    |    |    |    |       |    |
the quick brown fox jumps over the     lazy dog

Et quand j'ai exécuté cette ligne server.start() une alerte de sécurité Windows apparaît et je pensais que c'était la faute du pare-feu pendant tout ce temps, alors je suis allé aux paramètres du pare-feu pour permettre au binaire Java (TM) Platform SE à travers le pare-feu. Je pensais que cela résoudrait le problème mais lorsque je rouvre l'éditeur et exécute le code, j'obtiens toujours la même erreur:

Traceback (most recent call last):
  File "E:\classifier\feature_extraction.py", line 503, in <module>
    print(feature_extraction(test_file_id))
  File "E:\classifier\feature_extraction.py", line 130, in feature_extraction
    with CoreNLPServer() as server:
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 170, in __enter__
    self.start()
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 149, in start
    'Could not connect to the server.'
nltk.parse.corenlp.CoreNLPServerError: Could not connect to the server.

tesslo le 7 juin 2017

Une fois que vous avez démarré le serveur, pouvez-vous accéder à http: // localhost : 9000 dans votre navigateur?

Vous pouvez également démarrer le serveur vous-même, reportez-vous à https://stanfordnlp.github.io/CoreNLP/corenlp-server.html

Celui qui est en cours d'exécution, et vous pouvez y accéder via le navigateur, vous devriez pouvoir utiliser l'analyseur:

parser = CoreNLPParser(url='http://localhost:9000')
# and so on

dimazest le 7 juin 2017

Pour le savoir, j'exécute à nouveau l'exemple dans l'invite de commande, mais cette fois, j'obtiens l'erreur familière

Python 3.5.3 |Anaconda custom (64-bit)| (default, Feb 22 2017, 21:28:42) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from nltk.parse.corenlp import *
>>> global server
>>> server = CoreNLPServer()
>>> server.start()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 149, in start
    'Could not connect to the server.'
nltk.parse.corenlp.CoreNLPServerError: Could not connect to the server.
>>> server.start()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Admin\Anaconda3\lib\site-packages\nltk\parse\corenlp.py", line 149, in start
    'Could not connect to the server.'
nltk.parse.corenlp.CoreNLPServerError: Could not connect to the server.

... Et je n'ai aucune idée de ce qui s'est passé entre les deux. Je n'ai changé aucune configuration.

Je voulais déplacer ce projet vers Linux il y a longtemps, mais je continue à recevoir l'erreur NLTK was unable to find ***.jar! Set the CLASSPATH environment variable sous Linux. J'ai défini CLASSPATH dans /etc/environment , /etc/profile et ~/.bash_profile et j'ai même essayé de copier ces fichiers dans $JAVA_HOME/lib/ mais le problème persiste. Dois-je ouvrir un autre numéro?

tesslo le 7 juin 2017

Êtes-vous capable de démarrer un serveur corenlp à partir d'un terminal (pas de python), consultez https://stanfordnlp.github.io/CoreNLP/corenlp-server.html pour plus de détails?

# Run the server using all jars in the current directory (e.g., the CoreNLP home directory)
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000

dimazest le 9 juin 2017

E:\classifier\stanford\stanford-corenlp-full-2016-10-31>java -mx4g -cp "E:\classifier\stanford\stanford-corenlp-full-2016-10-31" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000
Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLPServer

E:\classifier\stanford\stanford-corenlp-full-2016-10-31>java -Xmx4g -cp "E:\classifier\stanford\stanford-corenlp-full-2016-10-31" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-chinese.properties -port 9000 -timeout 15000
Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLPServer

E:\classifier\stanford\stanford-corenlp-full-2016-10-31>java -mx4g -cp "E:\classifier\stanford\stanford-corenlp-full-2016-10-31" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -timeout 15000
Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLPServer

Ne semble pas. Est-ce que je le fais correctement?

tesslo le 10 juin 2017

Je fais enfin fonctionner ces modules Stanford sous Linux. Avec les mêmes lignes de code, le serveur CoreNLP semble démarrer sans problème mais j'obtiens d'autres erreurs sur la ligne où je boucle sur les résultats de l'analyse.

Traceback (most recent call last):
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/connection.py", line 141, in _new_conn
    (self.host, self.port), self.timeout, **extra_kw)
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/util/connection.py", line 83, in create_connection
    raise err
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/util/connection.py", line 73, in create_connection
    sock.connect(sa)
ConnectionRefusedError: [Errno 111] Connection refused

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/connectionpool.py", line 600, in urlopen
    chunked=chunked)
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/connectionpool.py", line 356, in _make_request
    conn.request(method, url, **httplib_request_kw)
  File "/home/tesslo/anaconda3/lib/python3.5/http/client.py", line 1107, in request
    self._send_request(method, url, body, headers)
  File "/home/tesslo/anaconda3/lib/python3.5/http/client.py", line 1152, in _send_request
    self.endheaders(body)
  File "/home/tesslo/anaconda3/lib/python3.5/http/client.py", line 1103, in endheaders
    self._send_output(message_body)
  File "/home/tesslo/anaconda3/lib/python3.5/http/client.py", line 934, in _send_output
    self.send(msg)
  File "/home/tesslo/anaconda3/lib/python3.5/http/client.py", line 877, in send
    self.connect()
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/connection.py", line 166, in connect
    conn = self._new_conn()
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/connection.py", line 150, in _new_conn
    self, "Failed to establish a new connection: %s" % e)
requests.packages.urllib3.exceptions.NewConnectionError: <requests.packages.urllib3.connection.HTTPConnection object at 0x7f110a9c4940>: Failed to establish a new connection: [Errno 111] Connection refused

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/adapters.py", line 438, in send
    timeout=timeout
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/connectionpool.py", line 649, in urlopen
    _stacktrace=sys.exc_info()[2])
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/packages/urllib3/util/retry.py", line 388, in increment
    raise MaxRetryError(_pool, url, error or ResponseError(cause))
requests.packages.urllib3.exceptions.MaxRetryError: HTTPConnectionPool(host='localhost', port=9000): Max retries exceeded with url: /?properties=%7B%22annotators%22%3A+%22tokenize%2Cpos%2Clemma%2Cssplit%2Cdepparse%22%2C+%22outputFormat%22%3A+%22json%22%2C+%22ssplit.isOneSentence%22%3A+%22true%22%7D (Caused by NewConnectionError('<requests.packages.urllib3.connection.HTTPConnection object at 0x7f110a9c4940>: Failed to establish a new connection: [Errno 111] Connection refused',))

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/media/tesslo/classifier/feature_extraction.py", line 503, in <module>
    print(feature_extraction(test_file_id))
  File "/media/tesslo/classifier/feature_extraction.py", line 142, in feature_extraction
    for line in dep_parse:
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/nltk/parse/corenlp.py", line 279, in raw_parse_sents
    parsed_data = self.api_call(sentence, properties=default_properties)
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/nltk/parse/corenlp.py", line 247, in api_call
    timeout=60,
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/sessions.py", line 565, in post
    return self.request('POST', url, data=data, json=json, **kwargs)
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/sessions.py", line 518, in request
    resp = self.send(prep, **send_kwargs)
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/sessions.py", line 639, in send
    r = adapter.send(request, **kwargs)
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/requests/adapters.py", line 502, in send
    raise ConnectionError(e, request=request)
requests.exceptions.ConnectionError: HTTPConnectionPool(host='localhost', port=9000): Max retries exceeded with url: /?properties=%7B%22annotators%22%3A+%22tokenize%2Cpos%2Clemma%2Cssplit%2Cdepparse%22%2C+%22outputFormat%22%3A+%22json%22%2C+%22ssplit.isOneSentence%22%3A+%22true%22%7D (Caused by NewConnectionError('<requests.packages.urllib3.connection.HTTPConnection object at 0x7f110a9c4940>: Failed to establish a new connection: [Errno 111] Connection refused',))

Pour info, Linux et Windows partagent le même matériel.

tesslo le 10 juin 2017

Ok, il y a deux étapes:
1) Démarrez un processus Java CoreNLP. Il y a deux façons, je vous suggère de démarrer manuellement, qui utilise la commande java -Xmx4g -cp ... . Avez-vous réussi? Vous devriez pouvoir accéder au serveur via un navigateur en visitant http: // localhost: 9000. Vous devriez voir dans la sortie de la console, quel port est utilisé.
2) Une fois le serveur en cours d'exécution, vous pouvez créer un client python CoreNLP parser = CoreNLPParser(url='http://localhost:9000') . Comme vous avez démarré le serveur Java CoreNLP par vous-même, vous n'avez pas besoin de le démarrer dans la session python (ne lancez pas server = CoreNLPServer() )

Les messages d'erreur que vous publiez suggèrent que le serveur CoreNLP Java n'est pas en cours d'exécution.

dimazest le 10 juin 2017

Ça a échoué:

tesslo<strong i="6">@TLU</strong>:/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31$ java -mx4g -cp "/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000
Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLPServer
tesslo<strong i="7">@TLU</strong>:/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31$ java -Xmx4g -cp "/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-chinese.properties -port 9000 -timeout 15000
Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLPServer
tesslo<strong i="8">@TLU</strong>:/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31$ java -mx4g -cp "/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -timeout 15000
Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLPServer

Et http: // localhost : 9000 affiche une erreur ERR_CONNECTION_REFUSED

tesslo le 11 juin 2017

L'avez-vous essayé avec "*" comme chemin de classe: j ava -mx4g -cp "*" ... ?

dimazest le 11 juin 2017

Salut, semble que j'ai également rencontré ce problème. Ma phrase est:
`` Peut-être, un cordon de 2 pieds 21/2? '', U'Et c'est d'une qualité moins chère que la partie du chargeur sur laquelle se branche le micro usb ... '
Et j'ai essayé de comprendre, il semble que le «/» provoque cette erreur.

csn6666 le 20 juin 2017

@caisinong avez-vous essayé d'utiliser la nouvelle interface CoreNLP? Voir mes commentaires ci-dessus.

dimazest le 20 juin 2017

@dimazest Désolé pour le retard. Je viens de faire:

tesslo<strong i="7">@TLU</strong>:/media/tesslo/classifier/stanford/stanford-corenlp-full-2016-10-31$ java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000
[main] INFO CoreNLP - --- StanfordCoreNLPServer#main() called ---
[main] INFO CoreNLP - setting default constituency parser
[main] INFO CoreNLP - warning: cannot find edu/stanford/nlp/models/srparser/englishSR.ser.gz
[main] INFO CoreNLP - using: edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz instead
[main] INFO CoreNLP - to use shift reduce parser download English models jar from:
[main] INFO CoreNLP - http://stanfordnlp.github.io/CoreNLP/download.html
[main] INFO CoreNLP -     Threads: 2
[main] INFO CoreNLP - Starting server...
[main] INFO CoreNLP - StanfordCoreNLPServer listening at /0:0:0:0:0:0:0:0:9000

Je peux visiter http: // localhost : 9000 maintenant, mais de retour à l'éditeur, j'obtiens toujours cette erreur sur la ligne de démarrage du serveur:

Traceback (most recent call last):
  File "/media/tesslo/classifier/feature_extraction.py", line 503, in <module>
    print(feature_extraction(test_file_id))
  File "/media/tesslo/classifier/feature_extraction.py", line 130, in feature_extraction
    with CoreNLPServer() as server:
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/nltk/parse/corenlp.py", line 170, in __enter__
    self.start()
  File "/home/tesslo/anaconda3/lib/python3.5/site-packages/nltk/parse/corenlp.py", line 149, in start
    'Could not connect to the server.'
nltk.parse.corenlp.CoreNLPServerError: Could not connect to the server.

tesslo le 25 juin 2017

Une fois que vous avez démarré un serveur manuellement, vous n'avez pas besoin de démarrer le serveur dans le code.

Gardez le serveur en marche et instanciez l'analyseur:

parser = CoreNLPParser(url='http://localhost:9000')

dimazest le 25 juin 2017

👍2

@dimazest Le problème a été résolu. Merci pour votre aide et votre patience pendant tout ce temps!

tesslo le 13 juil. 2017

🎉1 👍1

J'ai une expérience similaire. Le démarrage du serveur Stanford CorenNLP dans le code est compliqué et ne doit être utilisé qu'à des fins de test. Peut-être que nous ne devrions pas exposer cela à l'utilisateur.

alvations le 13 juil. 2017

Je suis content que les choses fonctionnent. En effet, le serveur doit être démarré en dehors du code Python.

dimazest le 14 juil. 2017

👍1

Corrigé et résolu par la nouvelle API CoreNLP =)

alvations le 4 oct. 2017

@dimazest Salut ... si le texte contient \ ou / solution pour Assertion Error est d'utiliser uniquement le Core NLP? j'utilise stanford-parser-full-2017-06-09
La phrase utilisée pour l'analyse était Iraqi security forces drove Islamic State fighters from the centre of a town just south of the militants\' main stronghold of Mosul on Saturday and reached within a few km (miles) of an airport on the edge of the city, a senior commander said.