Nltk: Verbnet corpus kedaluwarsa

Dibuat pada 5 Mei 2018  ·  13Komentar  ·  Sumber: nltk/nltk

Indeks data nltk (https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml) menunjukkan verbnet ke versi 2.1. Definisi verbnet adalah 3.2.

Versi terbaru telah memperbarui deskripsi bingkai yang memberikan lebih banyak informasi tentang struktur frasa. Misalnya, deskripsi utama bingkai dari kelas future_having-13.3 di versi terbaru adalah NP V NP-Dative NP , menjelaskan struktur bingkai sebagai (kata benda-frase, kata kerja, kata benda-frase (dative), kata benda- frase) sedangkan di versi 2.1 hanya membaca Dative .

bug corpus enhancement nltk_data

Komentar yang paling membantu

@bayu_joo
Itu berhasil untuk apa yang saya gunakan. Izinkan saya menunjukkan kode saya:

import nltk
v3 = nltk.corpus.util.LazyCorpusLoader(
    'verbnet3', nltk.corpus.reader.verbnet.VerbnetCorpusReader,
    r'(?!\.).*\.xml')
v3.classids('add') # returns ['mix-22.1-2', 'multiply-108', 'say-37.7-1']

Agar berfungsi, Anda perlu mengunduh verbnet3 dari sini . Unzip file ini di folder ~/nltk_data/corpora~. When unzipped it should create a new folder ~ / nltk_data / corpora / verbnet3 which contains all the Verbnet3 definitions. Then you should be able to run the code above. Notice that for Verbnet 2 (the default) the code v3.classids ('add') `hanya mengembalikan kelas pertama (mix-22.1-2).

Karena pada dasarnya hanya itu yang saya gunakan Verbnet3 karena saya belum menguji API lain, tetapi metode classids telah diuji pada banyak kata yang berbeda dan semuanya berfungsi. Semoga membantu!

Semua 13 komentar

@agodbehere , terima kasih telah melaporkan masalah ini. Saya telah memverifikasi bahwa pembaca korpus verbnet 2 yang ada rusak pada data verbnet 3, jadi keduanya harus hidup berdampingan satu sama lain dalam koleksi korpus.

Langkah selanjutnya adalah seseorang memberikan kontribusi kepada pembaca korpus yang sesuai nltk.corpus.verbnet3 , yang diharapkan dapat membagikan beberapa kode yang ada.

Kami perlu mendukung keduanya untuk sementara waktu.

@stevenbird , kasus pemecahan apa yang Anda temukan karena menggunakan pembaca korpus yang ada dengan verbnet 2? Saya tidak menjalankan rangkaian pengujian setelah memperbarui korpus, tetapi untuk kasus penggunaan saya (meminta classid dan frame), pembaca korpus yang ada berfungsi dengan baik.

Masalahnya ada dengan verbnet 3. Kami membutuhkan pembaca korpus yang berbeda untuk
bahwa.

Pada Rabu, 16 Mei 2018 10.45 Andrew Godbehere [email protected]
menulis:

@stevenbird https://github.com/stevenbird , kasus pelanggaran apa yang Anda alami
menemukan untuk menggunakan pembaca korpus yang ada dengan verbnet 2? Saya tidak menjalankan
uji suite setelah memperbarui korpus, tetapi untuk kasus penggunaan saya (meminta
classids dan frames), pembaca korpus yang ada berfungsi dengan baik.

-
Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/nltk/nltk/issues/2015#issuecomment-389363521 , atau bisukan
utasnya
https://github.com/notifications/unsubscribe-auth/AADYbsgbjtFTKsyamRPG0OpJuWnF3UJ0ks5ty33DgaJpZM4Tzc0d
.

@stevenbird @agodbehere Hai, Saya mengerjakan proyek VerbNet di CU Boulder dan dengan senang hati akan berkontribusi dan memelihara kode untuk pembaca korpus untuk VerbNet 3+.

@amosleokim : terima kasih, terima kasih!

Anda dapat melihat bahwa kami memiliki verbnet (2) dan verbnet3 data di sini .

Saya mengusulkan agar kami menambahkan entri untuk verbnet3 di sini

Dan kemudian cari tahu cara memperluas verbnet dan verbnet3 .

Bagaimana kedengarannya? Kami perlu mendukung keduanya secara bersamaan, dan (pada akhirnya) menghentikan penggunaan verbnet 2.

Kami memiliki saluran kendur NLTK di mana kami dapat mendiskusikan detailnya jika perlu. Terima kasih!

@stevenbird Kedengarannya bagus untuk saya! Jika Anda dapat mengirimi saya kode undangan ke saluran slack, saya akan melanjutkan sehingga kita dapat memulai seluk beluknya.

Ada kemajuan tentang topik ini? Saya mencoba menggunakan verbnet untuk penelitian dan keluaran yang saya dapatkan dari metode classids tampak aneh .

Terima kasih @stevenbird , versi lama tampaknya menjadi penyebab masalah. Saya dapat mengunduh verbnet3.zip secara manual dan membacanya dengan pembaca untuk verbnet 2.1 yang ada di nltk.

@salompas Hanya ingin memeriksa lagi, apakah verbnet API di NLTK berfungsi dengan verbnet3?

@bayu_joo
Itu berhasil untuk apa yang saya gunakan. Izinkan saya menunjukkan kode saya:

import nltk
v3 = nltk.corpus.util.LazyCorpusLoader(
    'verbnet3', nltk.corpus.reader.verbnet.VerbnetCorpusReader,
    r'(?!\.).*\.xml')
v3.classids('add') # returns ['mix-22.1-2', 'multiply-108', 'say-37.7-1']

Agar berfungsi, Anda perlu mengunduh verbnet3 dari sini . Unzip file ini di folder ~/nltk_data/corpora~. When unzipped it should create a new folder ~ / nltk_data / corpora / verbnet3 which contains all the Verbnet3 definitions. Then you should be able to run the code above. Notice that for Verbnet 2 (the default) the code v3.classids ('add') `hanya mengembalikan kelas pertama (mix-22.1-2).

Karena pada dasarnya hanya itu yang saya gunakan Verbnet3 karena saya belum menguji API lain, tetapi metode classids telah diuji pada banyak kata yang berbeda dan semuanya berfungsi. Semoga membantu!

@Salompas Hai, terima kasih atas solusinya! Versi verbnet3 apa yang merupakan 'verbnet3' Anda? Apakah ini versi 3.3 atau 3.2?

@Salompas Hai, terima kasih atas solusinya! Versi verbnet3 apa yang merupakan 'verbnet3' Anda? Apakah ini versi 3.3 atau 3.2?

Hai @ songhee-kim, sudah 2 tahun sejak saya mengerjakan ini, jadi saya tidak tahu persis versi mana yang saya miliki.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat

Masalah terkait

stevenbird picture stevenbird  ·  4Komentar

talbaumel picture talbaumel  ·  4Komentar

Chris00 picture Chris00  ·  3Komentar

jeryini picture jeryini  ·  5Komentar

libingnan54321 picture libingnan54321  ·  3Komentar