Doccano: Los campos de metadatos no se completan en la exportación

Creado en 17 jun. 2019  ·  4Comentarios  ·  Fuente: doccano/doccano


Información del sistema

  • Windows 10, con la última versión (extraída el 17/06/2019) Imagen de Docker
  • Versión de Python : n / a, usando la versión de Docker

Describe el problema

La documentación dice:

Cualquier otra columna (para csv) o clave (para json) se conserva y se exportará en la columna de metadatos o clave tal como está.

Pero este no es el comportamiento que estoy experimentando. Estoy usando la versión de imagen de Docker de Doccano que se ejecuta en un host de Windows 10. Para un proyecto de etiquetado de secuencia, importo datos en este formato de líneas JSON:

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

Después de etiquetar los datos, voy a _Editar datos_> _Exportar datos_ y exportarlos en los formatos _JSONL_ o _JSON (Etiquetas de texto) _ (el problema aparece de cualquier manera). Aquí está la salida que obtengo con la salida _JSON (Text-Labels) _:

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

No hay ningún campo de "metadatos" como se describe en la documentación, y el campo "metadatos" no contiene ninguno de mis metadatos necesarios para unir los ejemplos anotados con los demás datos relevantes necesarios para mi caso de uso.

Código fuente / registros

n / A

bug

Comentario más útil

Por lo que tengo entendido, debe utilizar explícitamente la clave "meta" tanto en la importación como en la exportación. Como en https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Entonces tu importación se vería así

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

Y luego su exportación también contendría el mismo campo. Funciona para mi. Pero supongo que la documentación debería actualizarse sobre eso.

Todos 4 comentarios

Probé esto nuevamente hoy con la última versión de Doccano de Docker, sigo viendo el mismo problema. Creo que esto se clasificaría mejor como un error que como una pregunta, ya que es un comportamiento inconsistente con la documentación.

Por lo que tengo entendido, debe utilizar explícitamente la clave "meta" tanto en la importación como en la exportación. Como en https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Entonces tu importación se vería así

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

Y luego su exportación también contendría el mismo campo. Funciona para mi. Pero supongo que la documentación debería actualizarse sobre eso.

Agregue esto a la documentación. Hoy me encontré con este problema.

¿Fue útil esta página
0 / 5 - 0 calificaciones