Nltk: Berfungsi untuk mengakses objek Synset menggunakan tombol sense

Dibuat pada 10 Jan 2018  ·  4Komentar  ·  Sumber: nltk/nltk

Saya mungkin melewatkannya tetapi apakah ada fungsi untuk mengakses objek Synset dari antarmuka wordnet NLTK dari tombol sense ?

Jika tidak, bisakah kita mengekspos fungsi yang dapat mencapainya di nltk.corpus.wordnet ? Misalnya https://stackoverflow.com/questions/48170666/how-to-get-the-gloss-given-sense-key-using-nltk-wordnet/

Idealnya, akan lebih baik jika memiliki fungsionalitas untuk mengakses objek Synset menggunakan:

  1. offset-pos , misalnya 1433493-a -> Synset('long.a.02')
  2. sense_key , misalnya long%3:00:02:: -> Synset('long.a.02')

Saat ini, kami memiliki synset_from_pos_and_offset() untuk (1).

Ada fungsi lain ( _synset_from_pos_and_line ) yang membaca baris berikut untuk mengembalikan Synset('long.a.02') :

01433493 00 a 01 long 1 016 = 05129201 n 0000 + 05133287 n 0101 ! 01436003 a 0101 & 01434007 a 0000 & 01434218 a 0000 & 01434530 a 0000 & 01434717 a 0000 & 01434841 a 0000 & 01434966 a 0000 & 01435060 a 0000 & 01435189 a 0000 & 01435290 a 0000 & 01435399 a 0000 & 01435507 a 0000 & 01435675 a 0000 & 01435891 a 0000 | primarily spatial sense; of relatively great or greater than average spatial extension or extension as specified; "a long road"; "a long distance"; "contained many long words"; "ten miles long" 

tapi itu bukan kunci rasa.

corpus enhancement goodfirstbug nice idea wordnet

Komentar yang paling membantu

Menerapkan fungsi yang disarankan di stackoverflow, tetapi tampaknya tidak memetakan ke pengertian yang benar -- misalnya, synset_from_sense_key('afraid%3:00:00::') mengembalikan afraid.a.04 alih-alih afraid.a.01 . Masalah ini meluas ke POS lain juga. (Kunci rasa diperoleh dari antarmuka online Wordnet )

Alih-alih, menggunakan metode yang ditunjukkan dalam dokumentasi SemCor tampaknya memetakan dengan benar -- saat ini ada fungsi lemma_from_key(key) yang tampaknya mengambil sesuatu yang mirip dengan sense key. Namun, lemma_from key(key) tidak mendukung satelit kata sifat (misalnya afraid%3:00:02:concerned:00 ). Saya pasti dapat menerapkan pembungkus sekitar lemma_from_key(key) untuk memperbaikinya dan mengembalikan Synset .

Semua 4 komentar

Saya ingin mengerjakan ini!

@craaaa Maaf telat balas, sempat pergi sebentar.

Jangan ragu untuk mengerjakannya dan buat PR setelahnya.
P/S: Jangan khawatir tentang merusak apa pun, akan ada pemeriksaan dan ulasan sebelum kami menggabungkan kode.

Menerapkan fungsi yang disarankan di stackoverflow, tetapi tampaknya tidak memetakan ke pengertian yang benar -- misalnya, synset_from_sense_key('afraid%3:00:00::') mengembalikan afraid.a.04 alih-alih afraid.a.01 . Masalah ini meluas ke POS lain juga. (Kunci rasa diperoleh dari antarmuka online Wordnet )

Alih-alih, menggunakan metode yang ditunjukkan dalam dokumentasi SemCor tampaknya memetakan dengan benar -- saat ini ada fungsi lemma_from_key(key) yang tampaknya mengambil sesuatu yang mirip dengan sense key. Namun, lemma_from key(key) tidak mendukung satelit kata sifat (misalnya afraid%3:00:02:concerned:00 ). Saya pasti dapat menerapkan pembungkus sekitar lemma_from_key(key) untuk memperbaikinya dan mengembalikan Synset .

@craaaa. Saya pikir masih ada masalah dengan satelit kata sifat. Saya mencoba menggunakan fungsi synset_from_sense_key dan inilah kesalahannya:

File "/home/izorar/anaconda3/lib/python3.7/site-packages/nltk/corpus/reader/wordnet.py", baris 1356, di synset, tingkatkan WordNetError(pesan % lemma) WordNetError: satelit kata sifat diminta tetapi hanya polos kata sifat ditemukan untuk lemma 'pertama'

Adakah ide tentang cara memperbaiki kesalahan?

Apakah halaman ini membantu?
0 / 5 - 0 peringkat

Masalah terkait

bcroy picture bcroy  ·  18Komentar

rain1024 picture rain1024  ·  22Komentar

matthew-z picture matthew-z  ·  47Komentar

53X picture 53X  ·  19Komentar

Kasran picture Kasran  ·  27Komentar