Nltk: функция ΠΊΠΎΠ»Π»ΠΎΠΊΠ°Ρ†ΠΈΠΉ Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ ΠΎΡˆΠΈΠ±ΠΊΡƒ

Π‘ΠΎΠ·Π΄Π°Π½Π½Ρ‹ΠΉ Π½Π° 15 мая 2019  Β·  10ΠšΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΈ  Β·  Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: nltk/nltk

Π― просматривал Π³Π»Π°Π²Ρƒ 1 ΠΊΠ½ΠΈΠ³ΠΈ, ΠΈ функция сопоставлСния Π²Π΅Ρ€Π½ΡƒΠ»Π° ΠΎΡˆΠΈΠ±ΠΊΡƒ. ΠŸΠΎΡ…ΠΎΠΆΠ΅, Ρ‡Ρ‚ΠΎ строка 440 Π² text.py ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Π°, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π±Ρ‹Π»Π° Π²Π²Π΅Π΄Π΅Π½Π° функция collocation_list. Π― исправил ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, пСрСписав Ρ‚Π΅ΠΊΡƒΡ‰ΡƒΡŽ строку 440 ΠΈ строку 441 Π² text.py.

старый ΠΊΠΎΠ΄:
collocation_strings = [w1 + '' + w2 для w1, w2 в self.collocation_list (num, window_size)] *
print (tokenwrap (collocation_strings, separator = ";"))

Π½ΠΎΠ²Ρ‹ΠΉ ΠΊΠΎΠ΄:
print (tokenwrap (self.collocation_list (), separator = ";"))

bug goodfirstbug resolved text

Π‘Π°ΠΌΡ‹ΠΉ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΉ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°ΠΊΠΆΠ΅ ΠΏΠΎ-ΠΏΡ€Π΅ΠΆΠ½Π΅ΠΌΡƒ Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ с .collocations() , Π½ΠΎ .collocation_list() Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚.

ВсС 10 ΠšΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Бпасибо @martinevanschouwenburg Π·Π° сообщСниС ΠΎΠ± ошибкС!

Π”Π°, ΠΏΠΎΡ…ΠΎΠΆΠ΅, Π½ΡƒΠΆΠ΅Π½ список словосочСтаний. Π§Ρ‚ΠΎΠ±Ρ‹ воспроизвСсти ΠΎΡˆΠΈΠ±ΠΊΡƒ:

$ python3
Python 3.6.4rc1 (v3.6.4rc1:3398dcb14f, Dec  5 2017, 00:58:30) 
[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> from nltk.book import *
*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908
>>> text4.collocations()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/nltk/text.py", line 440, in collocations
    collocation_strings = [w1 + ' ' + w2 for w1, w2 in self.collocation_list(num, window_size)]
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/nltk/text.py", line 440, in <listcomp>
    collocation_strings = [w1 + ' ' + w2 for w1, w2 in self.collocation_list(num, window_size)]
ValueError: too many values to unpack (expected 2)

Π― всС Π΅Ρ‰Π΅ Π²ΠΈΠΆΡƒ эту ΠΎΡˆΠΈΠ±ΠΊΡƒ ΠΏΡ€ΠΈ просмотрС Π³Π»Π°Π²Ρ‹ 1 ΠΊΠ½ΠΈΠ³ΠΈ.

* Π’Π²ΠΎΠ΄Π½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ для ΠΊΠ½ΠΈΠ³ΠΈ NLTK *
Π—Π°Π³Ρ€ΡƒΠ·ΠΊΠ° text1, ..., text9 ΠΈ sent1, ..., sent9
Π’Π²Π΅Π΄ΠΈΡ‚Π΅ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ тСкста ΠΈΠ»ΠΈ прСдлоТСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π΅Π³ΠΎ.
Π’Π²Π΅Π΄ΠΈΡ‚Π΅:'text () 'ΠΈΠ»ΠΈ' sents () ', Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹.
text1: Моби Π”ΠΈΠΊ, Π“Π΅Ρ€ΠΌΠ°Π½ МСлвилл, 1851 Π³.
text2: Чувство ΠΈ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Π”ΠΆΠ΅ΠΉΠ½ ΠžΡΡ‚ΠΈΠ½ 1811
text3: Книга Бытия
text4: ΠšΠΎΡ€ΠΏΡƒΡ ΠΈΠ½Π°ΡƒΠ³ΡƒΡ€Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ€Π΅Ρ‡ΠΈ
text5: ΠšΠΎΡ€ΠΏΡƒΡ Ρ‡Π°Ρ‚Π°
text6: ΠœΠΎΠ½Ρ‚ΠΈ ΠŸΠ°ΠΉΡ‚ΠΎΠ½ ΠΈ Бвятой Π“Ρ€Π°Π°Π»ΡŒ
text7: Wall Street Journal
text8: ΠŸΠ΅Ρ€ΡΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΉ корпус
text9: Π§Π΅Π»ΠΎΠ²Π΅ΠΊ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±Ρ‹Π» Ρ‡Π΅Ρ‚Π²Π΅Ρ€Π³ΠΎΠΌ Π”ΠΆ. К. ЧСстСртон 1908
ΠžΡ‚ΡΠ»Π΅ΠΆΠΈΠ²Π°Π½ΠΈΠ΅ (послСдний Π²Ρ‹Π·ΠΎΠ² послСдний):
Π€Π°ΠΉΠ» "c: \ Users \ Adam.vscode \ extensions \ ms-python.python-2019.6.24221 \ pythonFiles \ ptvsd_launcher.py", строка 43, Π²
основной (ptvsdArgs)
Π€Π°ΠΉΠ» "c: \ Users \ Adam.vscode \ extensions \ ms-python.python-2019.6.24221 \ pythonFiles \ lib \ python \ ptvsd__main __. Py", строка 434, Π² основном
Π±Π΅Π³Π°Ρ‚ΡŒ()
Π€Π°ΠΉΠ» "c: \ Users \ Adam.vscode \ extensions \ ms-python.python-2019.6.24221 \ pythonFiles \ lib \ python \ ptvsd__main __. Py", строка 312, Π² run_file
runpy.run_path (Ρ†Π΅Π»ΡŒ, run_name = '__ main__')
Π€Π°ΠΉΠ» "c: \ users \ adam \ appdata \ local \ programs \ python \ python37-32 \ Lib \ runpy.py", строка 263, Π² run_path
pkg_name = pkg_name, script_name = fname)
Π€Π°ΠΉΠ» "c: \ users \ adam \ appdata \ local \ programs \ python \ python37-32 \ Lib \ runpy.py", строка 96, Π² _run_module_code
имя_ΠΌΠΎΠ΄Π°, спСцификация_ΠΌΠΎΠ΄Π°, имя_ΠΏΠ°ΠΊΠ΅Ρ‚Π°, имя_сцСнария)
Π€Π°ΠΉΠ» "c: \ users \ adam \ appdata \ local \ programs \ python \ python37-32 \ Lib \ runpy.py", строка 85, Π² _run_code
exec (ΠΊΠΎΠ΄, run_globals)
Π€Π°ΠΉΠ» "c: \ Users \ Adam \ Documents \ code \ python \ natlang \ natlang.py", строка 4, Π²
text4.collocations ()
Π€Π°ΠΉΠ» "C: \ Users \ Adam.virtualenvs \ natlang-9ek-vNym \ lib \ site-packages \ nltk \ text.py", строка 444, Π² сочСтаниях
w1 + "" + w2 для w1, w2 в self.collocation_list (num, window_size)
Π€Π°ΠΉΠ» "C: \ Users \ Adam.virtualenvs \ natlang-9ek-vNym \ lib \ site-packages \ nltk \ text.py", строка 444, Π²
w1 + "" + w2 для w1, w2 в self.collocation_list (num, window_size)
ValueError: слишком ΠΌΠ½ΠΎΠ³ΠΎ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ для распаковки (оТидаСтся 2)

@networkjr Π― Ρ‚ΠΎΠΆΠ΅ ΠΌΠΎΠ³Ρƒ это ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΡ‚ΡŒ. ΠœΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ, исправлСниС Π² # 2227 Π΅Ρ‰Π΅ Π½Π΅ пСрСнСсСно Π² PyPi?

@networkjr Ρ‚ΠΎ ΠΆΠ΅ самоС ΠΈ с ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠΌ Anaconda

Π― Ρ€Π°Π±ΠΎΡ‚Π°ΡŽ Π½Π°Π΄ ΠΊΠ½ΠΈΠ³ΠΎΠΉ NLTK, я ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½ΠΎΠ²ΠΈΡ‡ΠΎΠΊ Π² NLTK ΠΈ довольно Π½ΠΎΠ²ΠΈΡ‡ΠΎΠΊ Π² Python - ΠΈ я ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽ Ρ‚Ρƒ ΠΆΠ΅ ΠΎΡˆΠΈΠ±ΠΊΡƒ.

$ python
Python 3.7.2 (default, Feb 14 2019, 11:13:53) 
[Clang 8.0.0 (clang-800.0.42.1)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> from nltk.book import *
*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908
>>> text4.collocations()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/george/code/nltk/py3env/lib/python3.7/site-packages/nltk/text.py", line 444, in collocations
    w1 + " " + w2 for w1, w2 in self.collocation_list(num, window_size)
  File "/Users/george/code/nltk/py3env/lib/python3.7/site-packages/nltk/text.py", line 444, in <listcomp>
    w1 + " " + w2 for w1, w2 in self.collocation_list(num, window_size)
ValueError: too many values to unpack (expected 2)

Богласно ΠΌΠΎΠ΅ΠΌΡƒ Pipfile.lock я ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽ NLTK 3.4.5, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ, ΠΊΠ°ΠΊ ΠΌΠ½Π΅ каТСтся, являСтся самым послСдним выпуском.

Π•ΡΡ‚ΡŒ Π»ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ этой ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹?

Π­Ρ‚ΠΎ Π±Ρ‹Π»ΠΎ исправлСно Π½Π° # 2377, Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ исправлСно Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ выпускС NLTK Π² блиТайшСС врСмя.

Π˜Π½Π°Ρ‡Π΅ Ссли Π½Π΅ Π΄ΠΎΠΆΠ΄Π΅Ρ‚Π΅ΡΡŒ =)

pip install -U https://github.com/nltk/nltk/archive/develop.zip

Π£ мСня всС Π΅Ρ‰Π΅ такая ΠΆΠ΅ ошибка послС обновлСния cntk с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ
pip install -U https://github.com/nltk/nltk/archive/develop.zip

ВСкущая вСрсия cnkt '3.4.5'

Как я ΠΌΠΎΠ³Ρƒ это ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ?

Π‘ΠΎΠ»ΡŒΡˆΠΎΠ΅ спасибо.

Π’Π°ΠΊΠΆΠ΅ ΠΏΠΎ-ΠΏΡ€Π΅ΠΆΠ½Π΅ΠΌΡƒ Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ с .collocations() , Π½ΠΎ .collocation_list() Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚.

Π—Π°ΠΌΠ΅Π½ΠΈΡ‚ΡŒ строку 444 Π² /nltk/text.py:
collocation_strings = [w1 + "" + w2 для w1, w2 Π² тСкстС. collocation_list (num, window_size)]

со ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ:
collocation_strings = [w вмСсто w Π² тСкстС.collocation_list (num, window_size)]

Π’ΠΎΠΆΠ΅ самоС. Π Π°Π±ΠΎΡ‚Π° с ΠΊΠ½ΠΈΠ³ΠΎΠΉ nltk Π΄Π°Π΅Ρ‚ ΠΎΡˆΠΈΠ±ΠΊΡƒ для collocations (), Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ collocation_list () Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚.

Π‘Ρ‹Π»Π° Π»ΠΈ эта страница ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ?
0 / 5 - 0 Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ΠΈ