Doccano: Champs de métadonnées non renseignés lors de l'exportation

Créé le 17 juin 2019  ·  4Commentaires  ·  Source: doccano/doccano


Informations système

  • Windows 10, exécutant le dernier (tiré le 17/06/2019) Image Docker
  • Version Python : n/a, en utilisant la version docker

Décris le problème

La documentation indique :

Toutes les autres colonnes (pour csv) ou clés (pour json) sont conservées et seront exportées telles quelles dans la colonne de métadonnées ou la clé.

Mais ce n'est pas le comportement que je vis. J'utilise la version d'image Docker de Doccano s'exécutant sur un hôte Windows 10. Pour un projet d'étiquetage de séquence, j'importe des données dans ce format de lignes JSON :

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

Après avoir étiqueté les données, je vais dans _Modifier les données_ > _Exporter les données_ et les exporter aux formats _JSONL_ ou _JSON(Text-Labels)_ (le problème apparaît dans les deux cas). Voici la sortie que j'obtiens avec la sortie _JSON (Text-Labels)_ :

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

Il n'y a pas de champ "métadonnées" comme décrit dans la documentation, et le champ "méta" ne contient aucune de mes métadonnées requises pour joindre les exemples annotés aux autres données pertinentes requises pour mon cas d'utilisation.

Code source / journaux

n / A

bug

Commentaire le plus utile

Pour autant que je sache, vous devez utiliser explicitement la clé "méta" à la fois pour l'importation et l'exportation. Comme dans https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Ainsi, votre importation ressemblerait à

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

Et puis votre exportation contiendrait également le même champ. Ça marche pour moi. Mais je suppose que la documentation devrait être mise à jour à ce sujet.

Tous les 4 commentaires

J'ai testé à nouveau cela aujourd'hui avec la dernière version de Doccano de Docker, je rencontre toujours le même problème. Je pense que cela serait mieux classé comme un bogue qu'une question car il s'agit d'un comportement incompatible avec la documentation.

Pour autant que je sache, vous devez utiliser explicitement la clé "méta" à la fois pour l'importation et l'exportation. Comme dans https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Ainsi, votre importation ressemblerait à

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

Et puis votre exportation contiendrait également le même champ. Ça marche pour moi. Mais je suppose que la documentation devrait être mise à jour à ce sujet.

Veuillez l'ajouter à la documentation. Je viens de tomber sur ce problème aujourd'hui.

Cette page vous a été utile?
0 / 5 - 0 notes