Doccano: Bidang Metadata tidak Diisi pada Ekspor

Dibuat pada 17 Jun 2019  ·  4Komentar  ·  Sumber: doccano/doccano


Sistem Informasi

  • Windows 10, menjalankan gambar Docker terbaru (ditarik pada 17/06/2019)
  • Versi Python : t/a, menggunakan versi buruh pelabuhan

Jelaskan masalahnya

Dokumentasi menyatakan:

Kolom lain (untuk csv) atau kunci (untuk json) dipertahankan dan akan diekspor dalam kolom metadata atau kunci apa adanya.

Tapi ini bukan perilaku yang saya alami. Saya menggunakan versi gambar Docker dari Doccano yang berjalan pada host Windows 10. Untuk proyek pelabelan urutan, saya mengimpor data dalam format baris JSON ini:

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

Setelah melabeli data, saya membuka _Edit Data_ > _Export Data_ dan mengekspor dalam format _JSONL_ atau _JSON(Text-Labels)_ (masalah muncul dengan cara apa pun). Berikut adalah output yang saya dapatkan dengan output _JSON (Text-Labels)_:

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

Tidak ada bidang "metadata" seperti yang dijelaskan dalam dokumentasi, dan bidang "meta" tidak berisi metadata saya yang diperlukan untuk menggabungkan contoh beranotasi kembali ke data relevan lain yang diperlukan untuk kasus penggunaan saya.

Kode sumber / log

tidak ada

bug

Komentar yang paling membantu

Sejauh yang saya mengerti, Anda perlu menggunakan kunci "meta" secara eksplisit baik pada impor maupun ekspor. Seperti di https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Jadi impor Anda akan terlihat seperti

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

Dan kemudian ekspor Anda juga akan berisi bidang yang sama. Itu bekerja untuk saya. Tapi saya kira dokumentasi harus diperbarui tentang itu.

Semua 4 komentar

Saya menguji ini lagi hari ini dengan versi terbaru Doccano dari Docker, saya masih melihat masalah yang sama. Saya percaya ini akan lebih baik diklasifikasikan sebagai bug daripada pertanyaan karena ini adalah perilaku yang tidak konsisten dengan dokumentasi.

Sejauh yang saya mengerti, Anda perlu menggunakan kunci "meta" secara eksplisit baik pada impor maupun ekspor. Seperti di https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Jadi impor Anda akan terlihat seperti

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

Dan kemudian ekspor Anda juga akan berisi bidang yang sama. Itu bekerja untuk saya. Tapi saya kira dokumentasi harus diperbarui tentang itu.

Silakan tambahkan ini ke dokumentasi. Saya baru saja mengalami masalah ini hari ini.

Oke - Saya membuka PR di sini: https://github.com/chakki-works/doccano/pull/315

Apakah halaman ini membantu?
0 / 5 - 0 peringkat