Nltk: рдореИрдВ рдиреЛрдЯрдмрдВрджреА рдЧреНрд░рд╛рдл рдХреЛ рдЬреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдореЗрдВ рдХреИрд╕реЗ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

рдХреЛ рдирд┐рд░реНрдорд┐рдд 3 рдЬреБрд▓ре░ 2017  ┬╖  7рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: nltk/nltk

рдореИрдВрдиреЗ рдмрд┐рдирд╛ рдХрд┐рд╕реА рднрд╛рдЧреНрдп рдХреЗ рд╕реНрдЯреИрдХрдУрд╡рд░рдлреНрд▓реЛ рдкрд░ рдпрд╣ рд╕рд╡рд╛рд▓ рдкрд╣рд▓реЗ рд╣реА рдкреВрдЫ рд▓рд┐рдпрд╛ рд╣реИ рдФрд░ рдЗрд╕реЗ рдпрд╣рд╛рдВ рдбреБрдкреНрд▓рд┐рдХреЗрдЯ рдХрд░рдиреЗ рдХрд╛ рдлреИрд╕рд▓рд╛ рдХрд┐рдпрд╛ рд╣реИред

рдХреЗ рдЕрдиреБрд╕рд╛рд░ рд╕реВрддреНрд░реЛрдВ рдХреЗ nltk рдпрд╣ рджреНрд╡рд╛рд░рд╛ рдЧреНрд░рд╛рдл рдбреНрд░реЙ tkinter (GUI) , рд▓реЗрдХрд┐рди рдореИрдВ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕ рдЧреНрд░рд╛рдл рдХреЛ рдЗрдирд▓рд╛рдЗрди рдХрд░рдиреЗ рдХреА рдЬрд░реВрд░рдд рд╣реИ jupyter notebook ред рдФрд░ рдореИрдВ рдЗрд╕реЗ рдПрдирд╛рдХреЛрдВрдбрд╛ 3 рд╕реЗ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдбреЙрдХрдЯрд░ рдХреЗ рдЕрдВрджрд░ рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ рджреВрд╕рд░реЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ рдореБрдЭреЗ рдпрд╣рд╛рдВ рдХрд┐рд╕реА рдкреЙрдкрдЕрдк рдЬреАрдпреВрдЖрдИ рдХреА рдЬрд░реВрд░рдд рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рд╕рд┐рд░реНрдл рдиреЛрдЯрдмреБрдХ рдХреЗ рдЕрдВрджрд░ рдХреА рдЫрд╡рд┐, рдЬрд┐рд╕реЗ nltk lib рджреНрд╡рд╛рд░рд╛ рд╕рд░реНрд╡рд░ рд╕рд╛рдЗрдб рдкрд░ рдкреНрд░рд╕реНрддреБрдд рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред

рдореИрдВ рдЗрд╕реЗ nltk рд╕реЗ рдХреИрд╕реЗ рдкрд╛рд░ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ? рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдерд░реНрдб рдкрд╛рд░реНрдЯреА рд▓рд┐рдмрд╛рд╕ рд╣реЛ рдЬреЛ рд╡рд╣рд╛рдВ рдорджрдж рдХрд░ рд╕рдХреЗ?

рдореЗрд░реА рдХреЛрд╢рд┐рд╢ рдХреЗ рд╕реНрд░реЛрдд рдпрд╣рд╛рдВ рд╣реИрдВ - рдЖрдЦрд┐рд░реА 18 рд╡реАрдВ рд╕реЗрд▓ред

chunkGram = r"""Chunk: {<RB.?>*<VB.?>*<NNP>+<NN>?}"""
chunkParser = nltk.RegexpParser(chunkGram)

for i in tokenized_text[:5]:
    words = nltk.word_tokenize(i)
    tagged = nltk.pos_tag(words)
    chunked = chunkParser.parse(tagged)
    chunked.draw()

рдкреБрдирд╢реНрдЪ:
рдПрдХ рд╣реА рд╕рдордп рдореЗрдВ matplotlib рдЗрдирд▓рд╛рдЗрди рдЕрдкрдиреЗ рдЖрдк рдореЗрдВ рдПрдХ рдЖрдХрд░реНрд╖рдг рдХреА рддрд░рд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдХреНрдпрд╛ рдореИрдВ рдЧреНрд░рд╛рдлрд╝ рд░реЗрдВрдбрд░рд┐рдВрдЧ рдХреЗ рд▓рд┐рдП matplotlib рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

рдзрдиреНрдпрд╡рд╛рдж!

bug corpus enhancement nice idea

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдЯрд┐рдВрдХрд░ рд╕реЗ рджреВрд░ рдЬрд╛рдирд╛ рд╕рд╛рдорд╛рдиреНрдп рд░реВрдк рд╕реЗ рдПрдХ рдЕрдЪреНрдЫрд╛ рд╡рд┐рдЪрд╛рд░ рд╣реИ, рд▓реЗрдХрд┐рди рдиреЛрдЯрдмреБрдХ рдореЗрдВ рдЗрдирд▓рд╛рдЗрди рдкреАрдПрдирдЬреА рдХреЗ рд░реВрдк рдореЗрдВ рдкреЗрдбрд╝реЛрдВ рдХреЛ рд░реЗрдВрдбрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рд╕рдорд░реНрдерди рд╣реИ:

`` ``
рдЖрдпрд╛рдд nltk
IPython.display рдЖрдпрд╛рдд рдкреНрд░рджрд░реНрд╢рди рд╕реЗ

parser = nltk.RegexpParser (r'NP: {<[NJ]ред *> +} ')
рдкреЗрдбрд╝ = parser.parse (nltk.corpus.brown.tagged_sents () [0))
рдкреНрд░рджрд░реНрд╢рди (рдкреЗрдбрд╝)
`` ``

рд╕рднреА 7 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рдареАрдХ рд╕рдВрднрд╡ рдХрд╛рдо рдХреЗ рдЖрд╕рдкрд╛рд╕ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ:

1 Xvfb ,
2 рдкреЗрдбрд╝ рдФрд░ рд╕реЗ рд╕реНрдХреНрд░реАрдирд╢реЙрдЯ
3 рдкреАрдЬреА рдХреЛ рдкреАрдПрдирдЬреА рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░рдирд╛
3 рдЗрдирд▓рд╛рдЗрдирд┐рдВрдЧ рд╕реНрдХреНрд░реАрдирд╢реЙрдЯ рдХреЛ рд╡рд╛рдкрд╕ jupyter рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░ рджрд┐рдпрд╛

рд▓реЗрдХрд┐рди рдореЗрд░реЗ рд▓рд┐рдП рдпрд╣ рдПрдХ рдЧрдВрджреЗ рд╣реИрдХ рдХреА рддрд░рд╣ рджрд┐рдЦрддрд╛ рд╣реИред рдкреЗрдбрд╝ рдХреЛ рд░реЗрдВрдбрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреБрдЫ рдФрд░ рдордЬрдмреВрдд рддрд░реАрдХреЗ рд╣реЛрдиреЗ рдЪрд╛рд╣рд┐рдПред

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рднреВрдЦрдВрдбреЛрдВ рдХреЗ рд▓рд┐рдП tkinter рд╕реЗ рджреВрд░ рдЬрд╛рдирд╛ рдФрд░ рдХрднреА рдЧреНрд░рд╛рдлрд┐рдХ рдкреНрд▓реЙрдЯрд┐рдВрдЧ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдХреА рдУрд░ рдмрдврд╝рдирд╛ рдЕрдЪреНрдЫрд╛ рдирд╣реАрдВ рд╣реИ, рдЬреИрд╕реЗ matplotlib / seaborn ред

рдЯрд┐рдВрдХрд░ рд╕реЗ рджреВрд░ рдЬрд╛рдирд╛ рд╕рд╛рдорд╛рдиреНрдп рд░реВрдк рд╕реЗ рдПрдХ рдЕрдЪреНрдЫрд╛ рд╡рд┐рдЪрд╛рд░ рд╣реИ, рд▓реЗрдХрд┐рди рдиреЛрдЯрдмреБрдХ рдореЗрдВ рдЗрдирд▓рд╛рдЗрди рдкреАрдПрдирдЬреА рдХреЗ рд░реВрдк рдореЗрдВ рдкреЗрдбрд╝реЛрдВ рдХреЛ рд░реЗрдВрдбрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рд╕рдорд░реНрдерди рд╣реИ:

`` ``
рдЖрдпрд╛рдд nltk
IPython.display рдЖрдпрд╛рдд рдкреНрд░рджрд░реНрд╢рди рд╕реЗ

parser = nltk.RegexpParser (r'NP: {<[NJ]ред *> +} ')
рдкреЗрдбрд╝ = parser.parse (nltk.corpus.brown.tagged_sents () [0))
рдкреНрд░рджрд░реНрд╢рди (рдкреЗрдбрд╝)
`` ``

рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдПрдХ рджреВрд░рд╕реНрде Jupyter рдиреЛрдЯрдмреБрдХ рд╕рд░реНрд╡рд░ рдкрд░ рдХрд╛рдо рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИред рдкреЗрдбрд╝ рдХреЗ _repr_png_() CanvasFrame() рдХреЙрд▓ рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рдЬреЛ рдПрдХ рдЯреАрдХреНрдЯрд░ рд╡рд┐рдВрдбреЛ рдмрдирд╛рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ (рдФрд░ рд░рд┐рдореЛрдЯ рд╕рд░реНрд╡рд░ рдкрд░ рдХреЛрдИ рдбрд┐рд╕реНрдкреНрд▓реЗ рдирд╣реАрдВ рд╣реИ)ред рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рд╕рд╣реА рд╕рдорд╛рдзрд╛рди рдХреНрдпрд╛ рд╣реИред

image

nltk = 3.2.4
ipython == 6.2.1
jupyter-core == 4.4.0

рдЕрдЪреНрдЫреА рдкрдХрдбрд╝!

рдХрд┐рд╕реА рдФрд░ рдиреЗ рдмрд╕ рдПрдХ рд╣реА рдмрд╛рдд рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдПрдХ рдирдпрд╛ рдореБрджреНрджрд╛ (# 1887) рдЦреЛрд▓рд╛ред рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдХреНрдпрд╛ рд╣рдо рдЙрдиреНрд╣реЗрдВ рдорд░реНрдЬ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рдмрд╕ rmalouf рд╕рдорд╛рдзрд╛рди рдЬреЛ рдХреБрдЫ tweaks рдХреЗ рдмрд╛рдж рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдореЗрдВ рдЬреЛрдбрд╝рдиреЗ рдХреЗ рд▓рд┐рдП:

рдореИрдХ
рдмреГрд╣рд╕реНрдкрддрд┐
рдкрд╛рдпрдерди 2.7

рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЛ рднреВрддреЛрдВ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛ рд╣реЛрдЧрд╛: https://wiki.scribus.net/canvas/Installation_and_Configuration_of_Ghostscript
рдХрд╛рдврд╝рд╛ рд╕реНрдерд╛рдкрд┐рдд рднреВрдд

рдпрджрд┐ рдпрд╣ xcrun рдХреЗ рдХрд╛рд░рдг рд╡рд┐рдлрд▓ рд░рд╣рддрд╛ рд╣реИ: рддреНрд░реБрдЯрд┐: рдЕрдорд╛рдиреНрдп рд╕рдХреНрд░рд┐рдп рдбреЗрд╡рд▓рдкрд░ рдкрде

рдлрд┐рд░ рдкрд╣рд▓реЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрд░реЗрдВ
http://mds.is/xcrun-error/ рджреЗрдЦреЗрдВ
xcode- рдЪрдпрди - рд╕реНрдерд╛рдкрдирд╛

рдореИрдВрдиреЗ рд╣рд╛рд▓ рд╣реА рдореЗрдВ рдПрдХ рд╢реБрджреНрдз рдкрд╛рдЗрдерди => рдПрд╕рд╡реАрдЬреА рдЯреНрд░реА-рдбреНрд░рд╛рдЗрдВрдЧ рдкреИрдХреЗрдЬ рдХреЛ рдПрдХ рд╕рд╛рде рд░рдЦрд╛ рд╣реИ, рдЬрд┐рд╕реЗ рдЬреБрдкрд┐рдЯрд░ рдореЗрдВ Tree рдХреЗ рдкреАрдВрдЧ-рдЖрдзрд╛рд░рд┐рдд рд░рд┐рдк рдХреЗ рд▓рд┐рдП рдбреНрд░реЙрдк-рдЗрди рд░рд┐рдкреНрд▓реЗрд╕рдореЗрдВрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдпрд╣ NLTK рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рд╕рднреА рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдЗрд╕рдХреЗ рд▓рд┐рдП рдЕрдЬрдЧрд░ 3 + рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ рдпрд╣ рдЕрднреА рднреА рдЗрд╕рдХреЗ рд░рд┐рд▓реАрдЬ рдЪрдХреНрд░ рдореЗрдВ рдмрд╣реБрдд рдЬрд▓реНрджреА рд╣реИ (рдФрд░ рдпрд╣ рдЖрдВрд╢рд┐рдХ рд░реВрдк рд╕реЗ рдЕрдиреНрдп рд╕рд╛рдорд╛рдиреЛрдВ рдХрд╛ рдПрдХ рдЧреБрдЪреНрдЫрд╛ рдмрдирд╛рдиреЗ рдХреЗ рдЙрджреНрджреЗрд╢реНрдп рд╕реЗ рд╣реИ рдЬреЛ рд╢рд╛рдпрдж рдЗрд╕ рджрд░реНрд╢рдХреЛрдВ рдХреЗ рд▓рд┐рдП рдХрдо рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рд╣реИ)ред рд▓реЗрдХрд┐рди, рдпрд╣ рдЗрд╕ рдзрд╛рдЧреЗ (рдФрд░ https://github.com/nltk/nltk/issues/1887) рдореЗрдВ рдЙрдард╛рдП рдЧрдП рдореБрджреНрджреЛрдВ рдХреЛ рд╣рд▓ рдХрд░рддрд╛ рд╣реИ, рдЬреЛ рдореБрдЭреЗ рднреА рдкрд░реЗрд╢рд╛рди рдХрд░ рд░рд╣реЗ рд╣реИрдВ:

https://github.com/rawlins/svgling

(рдирд╛рдпрдм рдпрджрд┐ рдЖрдк рдЬреБрдкрд┐рдЯрд░ рдореЗрдВ рдЯрд┐рдХреНрдХрд░ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ рд╕реЗ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдмрдЪрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рддреЛ рдЖрдкрдХреЛ _repr_png_() Tree рд╕реЗ рдирд┐рдХрд╛рд▓рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛ рд╕рдХрддреА рд╣реИред рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рд╣реИ рдХреНрдпреЛрдВрдХрд┐ Jupyter рд╕рднреА рдЙрдкрд▓рдмреНрдз _repr_*_ рдХрд╛рд░реНрдпреЛрдВ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐ рдпрд╣ рдХреЗрд╡рд▓ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдкрд░рд┐рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдПрдХ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдФрд░ рдиреЛрдЯрдмреБрдХ рдлрд╝рд╛рдЗрд▓ рдореЗрдВ рдЙрди рд╕рднреА рдХреЗ рдЙрддреНрдкрд╛рджрди рдХреЛ рдмрдЪрд╛рддрд╛ рд╣реИред)

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

stevenbird picture stevenbird  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

alvations picture alvations  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

stevenbird picture stevenbird  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

zdog234 picture zdog234  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

BLKSerene picture BLKSerene  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ