私はそれを見逃したかもしれませんが、センスキーからNLTKワードネットインターフェースからSynset
オブジェクトにアクセスする機能はありますか?
ない場合は、 nltk.corpus.wordnet
でそれを実現できる関数を公開できますか? 例: https :
理想的には、以下を使用してSynset
オブジェクトにアクセスする機能があると便利です。
offset-pos
、例: 1433493-a
-> Synset('long.a.02')
sense_key
、例: long%3:00:02::
-> Synset('long.a.02')
現在、(1)のsynset_from_pos_and_offset()
があります。
次の行を読み取ってSynset('long.a.02')
を返す別の関数( _synset_from_pos_and_line
)があります。
01433493 00 a 01 long 1 016 = 05129201 n 0000 + 05133287 n 0101 ! 01436003 a 0101 & 01434007 a 0000 & 01434218 a 0000 & 01434530 a 0000 & 01434717 a 0000 & 01434841 a 0000 & 01434966 a 0000 & 01435060 a 0000 & 01435189 a 0000 & 01435290 a 0000 & 01435399 a 0000 & 01435507 a 0000 & 01435675 a 0000 & 01435891 a 0000 | primarily spatial sense; of relatively great or greater than average spatial extension or extension as specified; "a long road"; "a long distance"; "contained many long words"; "ten miles long"
しかし、それはセンスキーではありません。
これに取り組みたいです!
@craaaa返信が遅くなってすみません、
気軽に取り組んで、後でPRを作成してください。
P / S:何かを壊す心配はありません。コードをマージする前に、チェックとレビューが行われます。
stackoverflowの中で示唆された機能を実装し、正しい感覚にマッピングしていないようでした-例えば、 synset_from_sense_key('afraid%3:00:00::')
返さafraid.a.04
の代わりにafraid.a.01
。 この問題は他のPOSにも当てはまります。 (センスキーはWordnetのオンラインインターフェイスから取得され
代わりに、 SemCorのドキュメントに示されている方法を使用すると、正しくマップされているように見えます。現在、センスキーに似たものを取り込んでいるように見えるlemma_from_key(key)
関数があります。 ただし、 lemma_from key(key)
は形容詞衛星をサポートしていません(例: afraid%3:00:02:concerned:00
)。 これを修正してSynset
を返すために、 lemma_from_key(key)
ラッパーを確実に実装できます。
@craaaa。 形容詞衛星にはまだ問題があると思います。 synset_from_sense_key関数を使用しようとしましたが、エラーは次のとおりです。
ファイル "/home/izorar/anaconda3/lib/python3.7/site-packages/nltk/corpus/reader/wordnet.py"、行1356、シンセットでWordNetError(message%lemma)を発生させるWordNetError:形容詞衛星が要求されましたが、プレーンのみ補題「最初」の形容詞が見つかりました
エラーを修正する方法について何かアイデアはありますか?
最も参考になるコメント
stackoverflowの中で示唆された機能を実装し、正しい感覚にマッピングしていないようでした-例えば、
synset_from_sense_key('afraid%3:00:00::')
返さafraid.a.04
の代わりにafraid.a.01
。 この問題は他のPOSにも当てはまります。 (センスキーはWordnetのオンラインインターフェイスから取得され代わりに、 SemCorのドキュメントに示されている方法を使用すると、正しくマップされているように見えます。現在、センスキーに似たものを取り込んでいるように見える
lemma_from_key(key)
関数があります。 ただし、lemma_from key(key)
は形容詞衛星をサポートしていません(例:afraid%3:00:02:concerned:00
)。 これを修正してSynset
を返すために、lemma_from_key(key)
ラッパーを確実に実装できます。