La documentation indique :
Toutes les autres colonnes (pour csv) ou clés (pour json) sont conservées et seront exportées telles quelles dans la colonne de métadonnées ou la clé.
Mais ce n'est pas le comportement que je vis. J'utilise la version d'image Docker de Doccano s'exécutant sur un hôte Windows 10. Pour un projet d'étiquetage de séquence, j'importe des données dans ce format de lignes JSON :
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
Après avoir étiqueté les données, je vais dans _Modifier les données_ > _Exporter les données_ et les exporter aux formats _JSONL_ ou _JSON(Text-Labels)_ (le problème apparaît dans les deux cas). Voici la sortie que j'obtiens avec la sortie _JSON (Text-Labels)_ :
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
Il n'y a pas de champ "métadonnées" comme décrit dans la documentation, et le champ "méta" ne contient aucune de mes métadonnées requises pour joindre les exemples annotés aux autres données pertinentes requises pour mon cas d'utilisation.
n / A
J'ai testé à nouveau cela aujourd'hui avec la dernière version de Doccano de Docker, je rencontre toujours le même problème. Je pense que cela serait mieux classé comme un bogue qu'une question car il s'agit d'un comportement incompatible avec la documentation.
Pour autant que je sache, vous devez utiliser explicitement la clé "méta" à la fois pour l'importation et l'exportation. Comme dans https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Ainsi, votre importation ressemblerait à
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
Et puis votre exportation contiendrait également le même champ. Ça marche pour moi. Mais je suppose que la documentation devrait être mise à jour à ce sujet.
Veuillez l'ajouter à la documentation. Je viens de tomber sur ce problème aujourd'hui.
Ok - j'ai ouvert un PR ici : https://github.com/chakki-works/doccano/pull/315
Commentaire le plus utile
Pour autant que je sache, vous devez utiliser explicitement la clé "méta" à la fois pour l'importation et l'exportation. Comme dans https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Ainsi, votre importation ressemblerait à
Et puis votre exportation contiendrait également le même champ. Ça marche pour moi. Mais je suppose que la documentation devrait être mise à jour à ce sujet.