La documentación dice:
Cualquier otra columna (para csv) o clave (para json) se conserva y se exportará en la columna de metadatos o clave tal como está.
Pero este no es el comportamiento que estoy experimentando. Estoy usando la versión de imagen de Docker de Doccano que se ejecuta en un host de Windows 10. Para un proyecto de etiquetado de secuencia, importo datos en este formato de líneas JSON:
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
Después de etiquetar los datos, voy a _Editar datos_> _Exportar datos_ y exportarlos en los formatos _JSONL_ o _JSON (Etiquetas de texto) _ (el problema aparece de cualquier manera). Aquí está la salida que obtengo con la salida _JSON (Text-Labels) _:
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
No hay ningún campo de "metadatos" como se describe en la documentación, y el campo "metadatos" no contiene ninguno de mis metadatos necesarios para unir los ejemplos anotados con los demás datos relevantes necesarios para mi caso de uso.
n / A
Probé esto nuevamente hoy con la última versión de Doccano de Docker, sigo viendo el mismo problema. Creo que esto se clasificaría mejor como un error que como una pregunta, ya que es un comportamiento inconsistente con la documentación.
Por lo que tengo entendido, debe utilizar explícitamente la clave "meta" tanto en la importación como en la exportación. Como en https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Entonces tu importación se vería así
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
Y luego su exportación también contendría el mismo campo. Funciona para mi. Pero supongo que la documentación debería actualizarse sobre eso.
Agregue esto a la documentación. Hoy me encontré con este problema.
Ok, abrí un PR aquí: https://github.com/chakki-works/doccano/pull/315
Comentario más útil
Por lo que tengo entendido, debe utilizar explícitamente la clave "meta" tanto en la importación como en la exportación. Como en https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Entonces tu importación se vería así
Y luego su exportación también contendría el mismo campo. Funciona para mi. Pero supongo que la documentación debería actualizarse sobre eso.