In der Dokumentation heißt es:
Alle anderen Spalten (für CSV) oder Schlüssel (für JSON) bleiben erhalten und werden unverändert in die Metadatenspalte oder den Schlüssel exportiert.
Aber das ist nicht das Verhalten, das ich erlebe. Ich verwende die Docker-Image-Version von Doccano, die auf einem Windows 10-Host ausgeführt wird. Für ein Sequenzkennzeichnungsprojekt importiere ich Daten in diesem JSON-Zeilenformat:
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
Nachdem ich die Daten beschriftet habe, gehe ich zu _Edit Data_> _Export Data_ und exportiere entweder in den Formaten _JSONL_ oder _JSON(Text-Labels)_ (Problem tritt in beiden Fällen auf). Hier ist die Ausgabe, die ich mit der Ausgabe von _JSON (Text-Labels)_ erhalte:
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
Es gibt kein "Metadaten"-Feld, wie in der Dokumentation beschrieben, und das "Meta"-Feld enthält keine meiner Metadaten, die erforderlich sind, um die annotierten Beispiele wieder mit den anderen relevanten Daten zu verbinden, die für meinen Anwendungsfall erforderlich sind.
n / A
Ich habe dies heute erneut mit der neuesten Version von Doccano von Docker getestet, ich sehe immer noch das gleiche Problem. Ich glaube, dies wäre besser als Fehler als als Frage einzustufen, da es sich um ein Verhalten handelt, das nicht mit der Dokumentation übereinstimmt.
Soweit ich weiß, müssen Sie sowohl beim Import als auch beim Export explizit den Schlüssel "meta" verwenden. Wie in https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
So würde Ihr Import aussehen
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
Und dann würde Ihr Export auch das gleiche Feld enthalten. Das ist für mich in Ordnung. Aber ich denke, die Dokumentation sollte dazu aktualisiert werden.
Bitte fügen Sie dies der Dokumentation bei. Ich bin heute erst auf dieses Problem gestoßen.
Ok - ich habe hier eine PR eröffnet: https://github.com/chakki-works/doccano/pull/315
Hilfreichster Kommentar
Soweit ich weiß, müssen Sie sowohl beim Import als auch beim Export explizit den Schlüssel "meta" verwenden. Wie in https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
So würde Ihr Import aussehen
Und dann würde Ihr Export auch das gleiche Feld enthalten. Das ist für mich in Ordnung. Aber ich denke, die Dokumentation sollte dazu aktualisiert werden.