Nltk: センスキーを使用してSynsetオブジェクトにアクセスする関数

作成日 2018年01月10日  ·  4コメント  ·  ソース: nltk/nltk

私はそれを見逃したかもしれませんが、センスキーからNLTKワードネットインターフェースからSynsetオブジェクトにアクセスする機能はありますか?

ない場合は、 nltk.corpus.wordnetでそれを実現できる関数を公開できますか? 例: https

理想的には、以下を使用してSynsetオブジェクトにアクセスする機能があると便利です。

  1. offset-pos 、例: 1433493-a -> Synset('long.a.02')
  2. sense_key 、例: long%3:00:02:: -> Synset('long.a.02')

現在、(1)のsynset_from_pos_and_offset()があります。

次の行を読み取ってSynset('long.a.02')を返す別の関数( _synset_from_pos_and_line )があります。

01433493 00 a 01 long 1 016 = 05129201 n 0000 + 05133287 n 0101 ! 01436003 a 0101 & 01434007 a 0000 & 01434218 a 0000 & 01434530 a 0000 & 01434717 a 0000 & 01434841 a 0000 & 01434966 a 0000 & 01435060 a 0000 & 01435189 a 0000 & 01435290 a 0000 & 01435399 a 0000 & 01435507 a 0000 & 01435675 a 0000 & 01435891 a 0000 | primarily spatial sense; of relatively great or greater than average spatial extension or extension as specified; "a long road"; "a long distance"; "contained many long words"; "ten miles long" 

しかし、それはセンスキーではありません。

corpus enhancement goodfirstbug nice idea wordnet

最も参考になるコメント

stackoverflowの中で示唆された機能を実装し、正しい感覚にマッピングしていないようでした-例えば、 synset_from_sense_key('afraid%3:00:00::')返さafraid.a.04の代わりにafraid.a.01 。 この問題は他のPOSにも当てはまります。 (センスキーはWordnetのオンラインインターフェイスから取得され

代わりに、 SemCorのドキュメントに示されている方法を使用すると、正しくマップされているように見えます。現在、センスキーに似たものを取り込んでいるように見えるlemma_from_key(key)関数があります。 ただし、 lemma_from key(key)は形容詞衛星をサポートしていません(例: afraid%3:00:02:concerned:00 )。 これを修正してSynsetを返すために、 lemma_from_key(key)ラッパーを確実に実装できます。

全てのコメント4件

これに取り組みたいです!

@craaaa返信が遅くなってすみません、

気軽に取り組んで、後でPRを作成してください。
P / S:何かを壊す心配はありません。コードをマージする前に、チェックとレビューが行われます。

stackoverflowの中で示唆された機能を実装し、正しい感覚にマッピングしていないようでした-例えば、 synset_from_sense_key('afraid%3:00:00::')返さafraid.a.04の代わりにafraid.a.01 。 この問題は他のPOSにも当てはまります。 (センスキーはWordnetのオンラインインターフェイスから取得され

代わりに、 SemCorのドキュメントに示されている方法を使用すると、正しくマップされているように見えます。現在、センスキーに似たものを取り込んでいるように見えるlemma_from_key(key)関数があります。 ただし、 lemma_from key(key)は形容詞衛星をサポートしていません(例: afraid%3:00:02:concerned:00 )。 これを修正してSynsetを返すために、 lemma_from_key(key)ラッパーを確実に実装できます。

@craaaa。 形容詞衛星にはまだ問題があると思います。 synset_from_sense_key関数を使用しようとしましたが、エラーは次のとおりです。

ファイル "/home/izorar/anaconda3/lib/python3.7/site-packages/nltk/corpus/reader/wordnet.py"、行1356、シンセットでWordNetError(message%lemma)を発生させるWordNetError:形容詞衛星が要求されましたが、プレーンのみ補題「最初」の形容詞が見つかりました

エラーを修正する方法について何かアイデアはありますか?

このページは役に立ちましたか?
0 / 5 - 0 評価

関連する問題

DavidNemeskey picture DavidNemeskey  ·  4コメント

stevenbird picture stevenbird  ·  4コメント

jeryini picture jeryini  ·  5コメント

goodmami picture goodmami  ·  4コメント

stevenbird picture stevenbird  ·  3コメント