Dokumentasi menyatakan:
Kolom lain (untuk csv) atau kunci (untuk json) dipertahankan dan akan diekspor dalam kolom metadata atau kunci apa adanya.
Tapi ini bukan perilaku yang saya alami. Saya menggunakan versi gambar Docker dari Doccano yang berjalan pada host Windows 10. Untuk proyek pelabelan urutan, saya mengimpor data dalam format baris JSON ini:
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
Setelah melabeli data, saya membuka _Edit Data_ > _Export Data_ dan mengekspor dalam format _JSONL_ atau _JSON(Text-Labels)_ (masalah muncul dengan cara apa pun). Berikut adalah output yang saya dapatkan dengan output _JSON (Text-Labels)_:
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
Tidak ada bidang "metadata" seperti yang dijelaskan dalam dokumentasi, dan bidang "meta" tidak berisi metadata saya yang diperlukan untuk menggabungkan contoh beranotasi kembali ke data relevan lain yang diperlukan untuk kasus penggunaan saya.
tidak ada
Saya menguji ini lagi hari ini dengan versi terbaru Doccano dari Docker, saya masih melihat masalah yang sama. Saya percaya ini akan lebih baik diklasifikasikan sebagai bug daripada pertanyaan karena ini adalah perilaku yang tidak konsisten dengan dokumentasi.
Sejauh yang saya mengerti, Anda perlu menggunakan kunci "meta" secara eksplisit baik pada impor maupun ekspor. Seperti di https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Jadi impor Anda akan terlihat seperti
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
Dan kemudian ekspor Anda juga akan berisi bidang yang sama. Itu bekerja untuk saya. Tapi saya kira dokumentasi harus diperbarui tentang itu.
Silakan tambahkan ini ke dokumentasi. Saya baru saja mengalami masalah ini hari ini.
Oke - Saya membuka PR di sini: https://github.com/chakki-works/doccano/pull/315
Komentar yang paling membantu
Sejauh yang saya mengerti, Anda perlu menggunakan kunci "meta" secara eksplisit baik pada impor maupun ekspor. Seperti di https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Jadi impor Anda akan terlihat seperti
Dan kemudian ekspor Anda juga akan berisi bidang yang sama. Itu bekerja untuk saya. Tapi saya kira dokumentasi harus diperbarui tentang itu.